Problem z znakom za evro

Povzetek: Precej neceremonialno je družba Microsoft lani spomladi v svoje kodne tabele dodala znak za evro. Način, kako je novi znak dodan v kodno tabelo, predstavlja potencialno nevarnost za trgovanje po internetu.

Črke in drugi znaki so v računalniku predstavljeni s številčno vrednostjo ali kodo. Običajna rešitev je prireditvena tabela, ki vsakemu znaku priredi neko kodo. Veliki črki A tako ustreza neka koda, veliki črki B neka druga koda, in tako dalje. Male črke imajo spet svoje kode, prav tako števke, ločila in drugi znaki. Takšni urejeni tabeli pravimo kodirani nabor znakov. Izmenjavo informacij olajša, če vsi uporabljamo enako prireditveno tabelo, oziroma isti kodirani nabor znakov. Kodirani nabori znakov so zato standardizirani, za usklajevanje standardov pa skrbijo standardizacijska telesa na državni in mednarodni ravni. Tak standardizirani nabor znakov je na primer JUS I.B1.002, adaptacija mednarodnega standarda ISO 646 za potrebe latinično pisočih narodov nekdanje Jugoslavije, v praksi pred leti dostikrat imenovan tudi YUSCII, kasneje pa, glede na geografsko širino in dolžino položaja pisočega, SLOSCII ali CROSCII.

Poleg mednarodnih standardov pa so v uporabi tudi takoimenovani industrijski standardi. Večina večjih podjetij računalniške opreme, npr. IBM, Microsoft, Apple, Hewlett-Packard ali DEC je mimo mednarodnih in državnih standardiziranih kodiranih naborov znakov razvila tudi svoje. Težav z njimi je več, od tega, da je na ta način otežena komunikacija med opremo različnih proizvajalcev, do tega, da proizvajalci pravzaprav niso dolžni javno objaviti specifikacij svojih internih standardov. Tisti, ki jih, pa jih lahko brez vnaprejšnjega obvestila kadarkoli spremenijo. Kar tudi počnejo.

Brez kakšnega posebnega pompa je Microsoft lani spomladi v svoje kodne tabele 1250-1257 dodal znak za evro. V kodni strani 1250, ki je v uporabi pri nas, in v kateri je napisanih večina strani na slovenskem delu svetovnega spleta, je bil znak dodan na doslej nezasedeno pozicijo 0x80. Posodobljena kodna stran, ki se od stare razlikuje še po dodanem znaku za negacijo na poziciji 0xAC, nosi enako oznako kot stara, torej kodna stran 1250.

To vnaša zmedo in predstavlja potencialno nevarnost pri trgovanju prek svetovnega spleta. V primeru, ko prodajalec ceno označi v evrih, kupec pa uporablja več kot leto dni star sistem, namreč slednji znaka za evro ne bo videl. Namesto njega bo videl vprašaj, vejico, kvadratek ali celo prazen prostor, odvisno od kombinacije operacijskega sistema in spletnega brskalnika, ki ga uporablja. Posebno zadnji primer -- prazen prostor -- lahko kupca zavede. Težava je v tem, da lahko tako kupec kot prodajalec utemeljeno trdita, da uporabljata kodno stran 1250.

Mednarodna organizacija za standardizacijo je ob reševanju istega problema ubrala drugačno pot. Kodirani nabor znakov ISO 8859-1 (Latin 1), ki je v rabi v večini zahodnega sveta, je pustila natančno takšen, kot je, in dodatno uvedla kodirani nabor znakov ISO 8859-15 (Latin 9), ki ima glede na ISO 8859-1 zamenjanih nekaj znakov. Vsak novi kodirani nabor znakov seveda vnese nekaj zmede v kodiranje besedil, kljub temu pa je takšna rešitev boljša, saj obstoječi spisi ostajajo kodirani v dobro določenem kodiranem naboru znakov.

Z izpostavljenim problemom bi rad ilustriral trditev, da so na področju kodiranja znakov industrijski standardi tega ali onega proizvajalca primerni le za zaprta okolja, medtem ko odprtost Interneta zahteva uporabo dobro definiranih standardov. To pa so le mednarodni standardi.

Primož Peterlin

[Pod naslovom "Problematični kodni znak za evro" objavljeno v dnevniku Delo, 22. februar 1999, str. 4]