Mga computerInformation technology

Encoding ng impormasyon teksto sa ang computer

Computer - isang sopistikadong aparato na kung saan maaari kang lumikha, i-convert, at mag-imbak ng impormasyon. Gayunman, ang computer ay hindi gumagana masyadong maliwanag na paraan para sa amin - graphic, teksto at mga numerong data ay naka-imbak bilang binary array mga numero. Sa artikulong ito kami ay tumingin sa kung paano ang encoding ng impormasyon ng teksto.

Ano ang para sa amin ay ang teksto ng isang computer - isang pagkakasunod-sunod ng mga character. Ang bawat simbolo ay kumakatawan sa isang tiyak na hanay ng mga zero at mga. Sa ilalim ng mga simbolo nilalayong hindi lamang upper at lower case titik ng Latin alpabeto, ngunit din bantas, arithmetic mga palatandaan, mga espesyal na mga character, mga espesyal na mga simbolo at kahit na space.

Binary encoding ng tekstuwal impormasyon

Sa pamamagitan ng pagpindot ng isang tiyak na key sa panloob na controller nagpapadala ng isang de-koryenteng signal na-convert sa isang binary code. Code ay maitugma sa isang tiyak na simbolo, na kung saan ay ipinapakita sa screen. Para sa pagsusumite sa alpabetong Latin sa isang digital format ASCII coding internasyonal na sistema ay nilikha. Nangangailangan ito ng 1 byte para sa pagtatala ng isang simbolo sa gayon ay binubuo ng walong-simbolo pagkakasunod-sunod ng mga zero at mga. Ang pag-record interval - mula sa 00000000 sa 11111111, ie coding ng impormasyon teksto gamit ang system na ito ay nagbibigay-daan sa amin upang kumatawan sa 256 mga character. Sa karamihan ng kaso, ito ay sapat.

ASCII ay nahahati sa dalawang bahagi. Ang unang 127 mga character (00,000,000-01,111,111) ay internasyonal at mga partikular na simbolo at titik ng Ingles alpabeto. Ang ikalawang bahagi - ang mga extension (10,000,000-11,111,111) - ay inilaan upang kumatawan sa pambansang alpabeto, ang pagsusulat ng kung saan ay naiiba mula sa Latin.

Pag-encode ng teksto impormasyon sa ASCII ay binuo sa prinsipyo ng pagtaas ng pagkakasunod-sunod, ibig sabihin, ang mas malaki ang pagkakasunod-sunod na bilang ng mga titik, mas malaki ang halaga ng kanyang ASCII-code. Mga numero at Russian bahagi ng talahanayan ay binuo sa parehong prinsipyo.

Gayunman, sa mundo may mga ilang mga uri ng pag-encode para Cyrillic titik. Ang pinaka-karaniwang - ay KOI-8 (walong-bit encoding na ginagamit para sa 70s sa unang ruifitsirovannyh Unix operating system), ISO 8859-5 (na binuo ng International standardisasyon Bureau), ang CP 1251 (coding tekstuwal impormasyon na ginagamit sa modernong OS Windows), pati na rin ang 2-byte encoding ng Unicode, na kung saan ay maaaring gamitin upang ipakilala ang 65,536 na mga character. Ang ganitong mga isang iba't ibang mga pag-encode dahil sa ang katunayan na sila ay binuo sa iba't ibang oras, para sa iba't ibang mga operating system at iba't ibang mga pagsasaalang-alang. Dahil dito, madalas ay may kahirapan kapag sa paglilipat ng teksto mula sa isang medium papunta sa isa pa - mula sa isang hindi pagtutugma encoding makakakita ang user ng isang hanay ng mga nakalilito mga icon. Paano ko aayusin ang sitwasyon na ito? Sa Word, halimbawa, kapag ang isang dokumento ay binuksan, ang isang mensahe tungkol sa mga problema na may teksto display at nag-aalok ng ilang mga pagpipilian para transcoding.

Kaya, coding at pagproseso ng tekstuwal impormasyon sa tiyan ng computer - ang proseso ay mahirap at oras-ubos na inorganisa. Ang lahat ng mga simbolo ng anumang alpabeto ay para lamang sa isang tiyak na pagkakasunod-sunod ng mga digit ng binary system, isang cell - ito ay isa byte ng impormasyon.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 tl.birmiss.com. Theme powered by WordPress.