Într-un comentariu primit zilele trecute, un cititor se plângea de caracterele pe care le folosesc pe weblog, mai exact de 'ș' și 'ț'. S-ar putea să știți că în versiunile anterioare de Windows, cele două litere erau reprezentate folosind caractere împrumutate din setul Latin2 (ISO-8859-2), mai exact U+015E (LATIN CAPITAL LETTER S WITH CEDILLA), U+015F (LATIN SMALL LETTER S WITH CEDILLA), U+0162 (LATIN CAPITAL LETTER T WITH CEDILLA) și U+0163 (LATIN SMALL LETTER T WITH CEDILLA), cunoscute și sub numele de "ș și ț cu sedilă". Pe siteul consorțiului Unicode găsiți aceste caractere în secțiunea Latin Extended-A.
Din câte știu, aceste caractere au fost preluate din setul folosit pentru limba turcă deoarece la vremea respectivă nu exista un standard pentru limba română (vorbim aici de mijlocul anilor '90). După cum v-ați dat seama deja, caracterele cu pricina sunt compuse din 's' și 't' și o sedilă atașată sub ele.
Problema este că în limba română, cele două caractere sunt compuse de fapt prin atașarea unei virgule și au fost introduse ceva mai târziu în standardele din domeniu (ISO-8859-16, care conține așa-numitul set Latin10). Cu alte cuvinte, caracterele corecte pentru limba română sunt U+0218 (LATIN CAPITAL LETTER S WITH COMMA BELOW), U+0219 (LATIN SMALL LETTER S WITH COMMA BELOW), U+021A (LATIN CAPITAL LETTER T WITH COMMA BELOW) și U+021B (LATIN SMALL LETTER T WITH COMMA BELOW), pe care le puteți găsi în secțiunea Latin Extended-B, paragraful "Additions for Romanian".
Pentru a nu lungi prea mult povestea, Windows Vista conține suport complet pentru aceste caractere, cu tot cu un layout nou pentru tastatură (pe care îl folosesc și pentru a scrie acest articol). Am aflat astăzi o veste bună de pe pagina lui Michael Kaplan, developer în grupul de internaționalizare de la Microsoft: Tocmai a fost lansat pe Microsoft Downloads un pachet pentru Windows XP numit European Union Expansion Font Update, care actualizează fonturile Times New Roman și Arial pentru a permite afișarea corectă a celor patru caractere noi.
Vestea mai puțin bună este că introducerea acestor caractere de la tastatură este mai dificilă în Windows XP, deoarece layout-ul implicit nu știe de ele. Totuși, există posibilitatea de a crea layout-uri particularizate de tastatură folosind Microsoft Keyboard Layout Creator, așa că există speranțe și pentru cei care vor să adopte noile caractere pe Windows XP. Oricum, cel puțin problema vizualizării este parțial rezolvată.
În loc de încheiere, mă gândeam că poate comunitatea românească de IT ar trebui să-i mulțumească și lui Cristian Secară, unul din primii care au remarcat inconsistența implementării diacriticelor în Windows și care a susținut în mod activ cauza adoptării și implementării standardelor pentru limba română. Vorbeam zilele trecute cu Tudor despre diverse subiecte și printre altele, îmi povestea că a fost foarte impresionat de gradul în care s-a implicat și de pasiunea pe care a arătat-o Cristian Secară în a urmări soluționarea acestei probleme.
Mai rămân de convertit de la formatul vechi documentele și bazele de date și am rezolvat-o și pe asta... Că tot veni vorba, pe Windows Vista am avut o vreme și layout-ul Romanian (Standard), și pe cel anterior, Romanian (Legacy). Am renunțat foarte repede la varianta veche, deoarece m-am obișnuit ușor cu cea nouă și pentru că trecerea de la engleză la română o fac cu Alt+Shift, dar trecerea de la un layout la altul în română se face cu Ctrl+Shift.
Cum folosesc foarte mult tastatura, și Ctrl+Shift (+ săgeată) e folosit și pentru a selecta blocuri de text (cuvânt cu cuvânt), ajunsesem să comut de la Legacy la Standard și invers de câteva ori pe document, fără să-mi dau seama. Dacă sunteți foarte atenți, o să remarcați asta în câteva articole de acum câteva săptămâni, care conțin și caracterele cu sedilă, și pe cele cu virgulă. Asta este, durerile tranziției...