RekenaarsInligtingstegnologie

Enkodering van teks inligting in die rekenaar

Rekenaar - 'n gesofistikeerde apparaat waarmee jy kan skep, omskep, en stoor inligting. Dit beteken egter die rekenaar nie baie verstaanbare manier te werk vir ons - grafiese, teks en numeriese data gestoor word as binêre skikkings nommers. In hierdie artikel sal ons kyk na hoe die enkodering van die teks inligting.

Wat vir ons is die teks van 'n rekenaar - 'n reeks van karakters. Elke simbool verteenwoordig 'n sekere stel van nulle en ene. Onder die simbole beteken nie net die boonste en onderste geval letters van die Latynse alfabet, maar ook leestekens, rekenkundige tekens, spesiale karakters, spesiale simbole en selfs ruimte.

Binêre encoding van tekstuele inligting

Deur te druk op 'n sekere sleutel op die interne kontroles stuur 'n elektriese sein wat omgeskakel word na 'n binêre kode. Kode verteenwoordig word deur 'n sekere simbool, wat op die skerm vertoon word. Vir voorlegging aan die Latynse alfabet in 'n digitale formaat ASCII kodering internasionale stelsel geskep is. Dit vereis 1 byte vir die registrasie van 'n simbool dus bestaan uit agt-simbool volgorde van nulle en ene. Die opname interval - 00000000-11111111, dit wil sê kodering van die teks inligting met behulp van hierdie stelsel stel ons in staat om 256 karakters verteenwoordig. In die meeste gevalle is dit genoeg.

ASCII is in twee dele verdeel. Die eerste 127 karakters (00.000.000-01111111) is internasionale en is spesifieke simbole en letters van die Engelse alfabet. Die tweede deel - die uitbreiding (10000000-11.111.111) - is bedoel om die nasionale alfabet, die skryf van wat verskil van die Latynse verteenwoordig.

Enkodering teks inligting in ASCII is gebou op die beginsel van toenemende volgorde, met ander woorde, hoe groter die volgorde aantal letters, hoe groter is die waarde van sy ASCII-kode. Figure en Russiese deel van die tafel is gebou op dieselfde beginsel.

Maar in die wêreld is daar verskeie vorme van kodering vir Cyrilliese letters. Die mees algemene - is KOI-8 (agt-bit kodering wat vir gebruik in die 70s in die eerste ruifitsirovannyh Unix operating stelsel), ISO 8859-5 (ontwikkel deur die Internasionale Standaardisasie Buro), die CP 1251 (kodering tekstuele inligting gebruik in die moderne bedryfstelsel Windows), asook 2-byte encoding van Unicode, wat gebruik kan word om 65.536 karakters bekend te stel. So 'n verskeidenheid van enkoderings te danke aan die feit dat hulle is ontwikkel op verskillende tye, vir verskillende bedryfstelsels en verskillende oorwegings. As gevolg hiervan, het dikwels probleme wanneer die oordrag van teks van een medium na 'n ander - van 'n wanverhouding enkodeer die gebruiker sal 'n stel van verwarrende ikone sien. Hoe kan ek hierdie situasie reg te stel? In Word, byvoorbeeld wanneer 'n dokument oopgemaak word, 'n boodskap oor probleme met teks vertoon en bied verskeie opsies vir kodewisseling.

So, kodering en verwerking van tekstuele inligting in ingewande die rekenaar se - die proses is moeilik en tydrowend georganiseer. Alle simbole van enige alfabet is net 'n sekere volgorde van syfers van binêre stelsel, een sel - dit is een byte van inligting.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 af.birmiss.com. Theme powered by WordPress.