Glitkoma reprezento kodas nombrojn per du vicoj de ciferoj:
123.4567 | -> | 12345670 | +3 |
0.001234567 | -> | 12345670 | -2 |
456 * 10 28 | -> | 45600000 | 30 |
0.23 * 10 -7 | -> | 23000000 | -7 |
Ne prezenteblas diversaj litergrandecoj kaj -tipoj,
grasa, oblikva, kursiva, altigita aux malaltigita skribo ktp.
Por kodi la literojn de la baza latina alfabeto,
tamen sen specialaj signoj de diversaj lingvoj
(ekzemple ä, ö,
ü, ß, à, ñ usw.)
establigxis normigita kodo, la
American Standard Code for Information Interchange
("Usona norma kodo por inform-intersxangxo),
akronime ASCII (Askio).
(Nur kelkaj komputilegoj ankoraux uzas alian kodon.)
ASCII kodas signojn en la malaltaj 7 bitoj de bajto;
la unua bito estas cxiam 0. Tiel disponeblas 27 = 128
malsamaj kombinoj, nome la bajtoj 0 = 00000000 bis 127 = 01111111.
La printeblaj signoj uzas la bajtojn 32 (spaceto) gxis 126 (~).
Kelkaj ekzemploj:
bitoj | bajta valoro dekuma | signifo |
---|---|---|
0000 1000 | 8 | retro-pasxo |
0000 1001 | 9 | tabo |
0000 1010 | 10 | nova linio |
0000 1101 | 13 | reveno |
0010 0000 | 32 | spaceto |
0011 0000 | 48 | 0 |
0011 0001 | 48 | 1 |
... | ... | ... |
0011 1001 | 48 | 9 |
0100 0001 | 65 | A |
0100 0010 | 66 | B |
0100 0011 | 67 | C |
0100 0100 | 68 | D |
0100 0101 | 69 | E |
... | ... | ... |
0101 1010 | 90 | Z |
0110 0001 | 97 | a |
0110 0010 | 98 | b |
... | ... | ... |
0111 1010 | 122 | z |
Sub UNIX, linion finas la bajto 10, sub DOS/Vindozo la kombino 13-10. La dosier-finon sub DOS/Vindozo markas la bajto 26; UNIX simple memoras la precizan longecon de la dosiero kaj tial ne bezonas specialan signon. Listo de cxiuj printeblaj Askiaj signoj troveblas jen.
La etnolingvaj specialaj simboloj (kiaj ekzemple ä, ö, ü, ß, é, è, ñ) foje estas kodataj per sxangxo de jenaj malpli uzataj Askiaj signoj: @[\]{|}~. Nun tamen plej ofte oni uzas la bajtojn inter 160 kaj 255. Cxar ili ne suficxas por cxiuj lingvoj, oni difinis diversajn normojn (laux ISO 8859), precipe:
Kvankam Vindozo uzas la kodon Latina-1 (sub la nomo "ANSI-kodo"), DOS-programoj ankoraux uzas IBM-kodon nekongruan kun ISO 8859. Tial tekstoj kun specialaj Latina-1-simboloj ne estas gxuste legeblaj en DOS-sxelo. Por demonstri tion jen mallonga teksto kun indiko de la vico da bajtoj kodantaj tiun tekston. Dekstre apud la bloko listiganta la bajtojn en dekuma prezento la signifo de la bajtoj inter 33 kaj 126 estas donita. Sub la pure Askia teksto sekvas frazo kun kelkaj umlauxtoj, koditaj per bajtoj pli grandaj ol 127. Videblas ke la Netscape-krozilo ne gxuste redonas tiujn umlauxtojn, cxar ili estis enigitaj per HP-komputilo.
Dum la lastaj jaroj aperis nova kodosistemo kun la nomo Unikodo (UNICODE). Tiu sistemo kodas cxiun signon en du bajtoj kaj tiel teorie povas kodi 216 = 65 milionojn da signoj. Tiel gxi povas kodi ne nur por la specialaj signoj de cxiuj latinskribaj lingvoj, sed ankaux por aliaj skriboj, inkluzive de la cxina. Tial probablas, ke Unikodo post kelkaj jaroj anstatauxos la 8-bitajn kodoj (precipe ISO 8859), tiel ke ne plu estos problemoj pro specialaj simboloj -- sed ankoraux ne estas tiel.
Pretere, cxar ecx du bajtoj ne suficxas por cxiuj nunaj kaj estontaj simboloj, oni jam difinis 4-bajtan kodon, normigitan kiel ISO 10646. Gxia unua "trancxajxo" (nomata BMP = basic multilingval plane = baza plurlingva tavolo) estas identa al Unikodo, tiel ke Unikodo ne arkaigxos pro la nova kodo.
Ekzistas multaj metodoj por stori tiajn arangxojn; neniu metodo povas nomigxi vera normo. Distingendas du klasoj de metodoj: tipografiaj metodoj kaj markaj (enhavaj) metodoj. Tipografiaj metodoj precize preskribas kiel arangxi la tekstpartojn; enhavaj metodoj nur markas, al kiu enhava speco apartenas la tekstpartoj (titolo, tekstokorpo, piednoto, ktp.) kaj lasas al iu programo la decidon, kiel arangxi ilin. Ekzemplo de tia marka lingvo estas HTML, uzata en la TTT-aj hipertekstoj.
La manko de normigita stormetodo kauxzas, ke arangxitaj tekstoj ofte estas dependaj de la programo, per kiu ili estis produktitaj. Se tiu programo ne plu estas disponebla, povas esti, ke la teksto farigxas senvalora.
Cxiu punkto de matrica bildoj havas difinitan kolor-valoron. Se eblas nur du valoroj, ekzemple "blanka" kaj "nigra", unu bito suficxas por unu punkto. Diversaj intensoj (grizecoj) permesas pli da detaloj; ofte oni uzas 256 nivelojn de grizeco.
Koloraj bildoj ofte estas kodataj per tri apartaj intensecoj de rugxo, verdo kaj bluo (RVB aux, angle, RGB). Minimume do necesas tri bitoj por havi 8 bazajn kolorojn laux la sekva tabelo:
|
Pro la grandaj kvantoj da datenoj en bildoj estas utile kompaktigi la informon. Tio ofte eblas per kodado ne de unuopaj punktoj, sed de vicoj da samkoloraj punktoj. Tiun metodon aplikas la konata telekopia kodo (FAX) por nigra-blankaj bildoj kaj la kodo GIF por koloraj bildoj. Ekzistas ankaux aliaj metodoj de kompaktigo.
Movigxantaj bildoj estas principe kodeblaj kiel vicoj de unuopaj bildoj. Por video-bildoj proponigxas kiel kompaktiga metodo, kodi nur la diferencojn inter du sinsekvaj bildoj.
Digxita kodado de sonoj okazas ekzemple sur muzikaj kompakt-diskoj (KD). Oni kodas per mezurado kaj diskretigo de analoga sonsignalo en egalaj intervaloj, do transformante la analogan signalon al "sxtupara" signalo kun egale largxaj sxtupoj.
La kvalito de la kodado dependas de la largxeco kaj de la alteco de la sxtupoj, do de la mezura frekvenco kaj de la precizeco de memorado. Krome gravas la nombro de kanaloj, normale unu (monofonio) aux du (stereofonio). La sekva tabelo listigas la unukanalajn elektojn cxe la PK-programo "sndrec".
frekvenco | precizeco | KB/s |
---|---|---|
8.000 Hz | 8 bitoj | 8 |
8.000 Hz | 16 bitoj | 16 |
11.025 Hz | 8 bitoj | 11 |
11.025 Hz | 16 bitoj | 22 |
22.050 Hz | 8 bitoj | 22 |
22.050 Hz | 16 bitoj | 43 |
44.100 Hz | 8 bitoj | 43 |
44.100 Hz | 16 bitoj | 172 |