informatica04

Continuano i post sul trattamento dei testi nelle lingue orientali.
Il codice HZ è una variante del GB, ed è stato sviluppato da una serie di esperti su internet di cui il più in vista è il dottor Fung-Fung Lee, per sopperire alle limitazioni imposte dai sistemi convenzionali di email e news.
Questo perché fino a poco tempo fa i server di posta funzionavano a 7 bit, e invece il codice GB utilizza tutti e 8 i bit di un byte.
Quindi quando spedisco una mail in GB e la mail transita attraverso uno di questi server (ora obsoleti), l’ottavo bit viene tranciato e il ricevente vede solo 乱码 (luànmǎ), scarabocchi (in giapponese, 文字化け – もじばけ).
L’idea geniale è stata di mischiare codice GB a 7 bit con caratteri ASCII e mettere dei delimitatori per dire “Qui inizia il testo in cinese”, “Qui finisce il testo in cinese”.
I delimitatori sono ‘~{‘ e ‘~}’.
Esempio:

Testo in italiano (o inglese)… 我是意大利人 altro testo…

diventa

Testo… ~{ÎÒÊÇÒâ´óÀûÈË~} Testo…

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>