SzámítógépekAdatbázisok

A szöveg használata. A fájl kódolásának meghatározása

Lássuk, mi a fájlkódolás. Egyszerűbben fogalmazva, a kódolás olyan byte karakterek sorozata, amelyek egy adott nyelv betűs ábécéjének felelnek meg. Minden egyes nyelv esetében létezik egy ilyen kódolási jel egy sorozata. Néha szükség van a kódolás meghatározására. Tekintsük ezt egy szöveges dokumentum példájára.

Amire szükséged van

Egyes szoftvereszközök. Először is, elég olyan alkalmazások, mint a Word , a KWrite, a Firefox és az elismerési eszköz - enca .

A fájl kódolását az univerzális Microsoft Word-szerkesztő segítségével határozhatja meg. Ezt megelőzően telepítenie kell az Office csomagból. Ha az alkalmazás telepítve van, és az ikon segítségével megnyitható az asztalon W szimbólum formájában, folytassa a következő lépéssel.

Az elismerés következő szakasza

Az alkalmazás navigációs sávjánál nyissa meg a "Fájl" - "nyitott" elemeket egyenként. Ugyanez a Ctrl + O billentyűkombináció .

Ezután a párbeszédpanelen válassza ki a kívánt könyvtárat, és valójában a fájlt az olvasáshoz. Miután kiválasztotta az egérrel, nyomja meg a "nyitott" gombot.

Ha a fájlnak nem egy CP1251 illesztése van , akkor az alkalmazás megpróbálja önmagában meghatározni a kódolást. Megjelenik a lehetséges mérkőzések listája. A lista jobb oldalán található javasolt karakterkészletek közül válasszon ki egy kódolást. Ha a választást helyesen végezte el, a felismert szöveg megjelenik a "minta" elemben.

A KWrite kódolásának meghatározása

A szövegszerkesztő előfeldolgozó mellett a Word további funkcionális segédprogramokat is tartalmaz. Az egyikük a KWrite (analóg a unix rendszerekhez). Annak érdekében, hogy ne keveredjen össze, írja le a feladat pontját "a dokumentum kódolásának meghatározásához a KWrite-ben".

  1. .txt fájl feltöltése az alkalmazásba.
  2. Próbálja újra a kódolást, amíg az egyik nem megfelelő.
  3. A 2. lépés végrehajtásához lépjen az eszköz opcióra a kódolási menüben.

Böngésző Mozilla Firefox, a cél ugyanaz - meghatározza a kódolást

Az elv ugyanúgy működik, mint a segédprogramokban a szöveges munkához. Futtassa a telepített böngészőt a végrehajtáshoz, és ha nincs telepítve, töltse le a telepítőt a mozilla.org-ból.

Ezután a program nyitott ablakában meg kell nyitnia egy szöveges dokumentumot a "Fájl" menüben, az "Open file" almenüben. Ha a kiválasztott fájl torzítás nélkül jelenik meg, és a szöveg olvasható, nem nehéz meghatározni a kódolást.

Ehhez menjen a "View" - "encoding" menüponthoz, több karakterkészletet jelenít meg, és az egyiket, amelyiknek van egy "kullancs", és van egy böngésző által definiált kódolás.

Ha a szöveg nem megfelelően lett felismerve, válassza a "kiegészítő" alfejezetet, kipróbálja a kódolást, vagy válassza ki az "auto" értéket.

Speciális szoftverek - dolgozik enca-val

Számos segéd elektronikus eszköz is létezik, amelyek lehetővé teszik a formázatlan szöveg kódolásának meghatározását.

Azok számára, akik szokás szerint unix alatt dolgoznak, az enca segédprogram alkalmas. Telepíthető a "Package Manager" szolgáltatással. Miután megtaláltuk a rendelkezésre álló csomagkategóriát, elkezdhetjük telepíteni a szoftvert.

Az elismerési nyelvek felsorolásához hajtsa végre az enca -list languages parancsot a terminál segítségével.

Ha meg akarja határozni a szövegfájl kódolását a (g) gomb után, írja be annak nevét, majd az (L) opció után körülbelül ugyanúgy adja meg az elismerési nyelvet:

Enca -L orosz -g /home/vic/temp/myfile.txt.

Összefoglalva, amit a kódolásról mondtak

Úgy vélem, hogy a fenti segédprogramok elegendő eszközt biztosítanak a felhasználónak a szöveges dokumentumok dekódolásához.

Eddig tényleg csak arról szól, hogy hogyan lehet felismerni a kódolást. Standard célokra gondolom, hogy a megadott szoftver nagyon alkalmas. Speciálisabb definíciós módszerek léteznek, de ezek vizsgálata túlmutat e cikkben.

A Microsoft Word esetében az elismerés forrása lehet egyszerű szöveg vagy összetett formátumú dokumentum.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hu.delachieve.com. Theme powered by WordPress.