informatica04

Created on: 2006-07-24 by admin

Continuano i post sul trattamento dei testi nelle lingue orientali.

Il codice HZ è una variante del GB, ed è stato sviluppato da una serie di esperti su internet di cui il più in vista è il dottor Fung-Fung Lee, per sopperire alle limitazioni imposte dai sistemi convenzionali di email e news.

Questo perché fino a poco tempo fa i server di posta funzionavano a 7 bit, e invece il codice GB utilizza tutti e 8 i bit di un byte.

Quindi quando spedisco una mail in GB e la mail transita attraverso uno di questi server (ora obsoleti), l'ottavo bit viene tranciato e il ricevente vede solo 乱码 (luànmǎ), scarabocchi (in giapponese, 文字化け - もじばけ).

L'idea geniale è stata di mischiare codice GB a 7 bit con caratteri ASCII e mettere dei delimitatori per dire "Qui inizia il testo in cinese", "Qui finisce il testo in cinese".

I delimitatori sono '~{' e '~}'.

Esempio:

Testo in italiano (o inglese)... 我是意大利人 altro testo...

diventa

Testo... ~{ÎÒÊÇÒâ´óÀûÈË~} Testo...

Comments:


No Copyright


No Copyright