ISO 11940 - ISO 11940

ISO 11940 är en ISO- standard för translitterering av thailändska tecken , publicerad 1998 och uppdaterad i september 2003 och bekräftad 2008. En tillägg till denna standard med namnet ISO 11940-2 definierar en förenklad transkription baserat på den.

Konsonanter

Thai
ISO k k̄h ḳ̄h kh k̛h ḳh ng c c̄h ch s c̣h
 
Thai  
ISO ṭ̄h .h t̛h d t t̄h th ṭh n
 
Thai  
ISO b sid p̄h ph f p̣h m
 
Thai
ISO y r v l ł w ṣ̄ s̛̄ x

Den omskrivning av de rena konsonanter härleds från deras uttal vanligt som en initial konsonant. En omärkt h används för att bilda digrafer som betecknar aspirerade konsonanter . Höga och låga par konsonanter differentieras systematiskt genom att applicera en makron på högklassskonsonanten. Ytterligare differentiering av konsonanter med identisk fonetisk funktion erhålls genom att lämna de vanligaste omärkta, markera det näst vanligaste med en punkt nedan, markera det tredje vanligaste med ett horn och markera det fjärde vanligaste genom att understryka. Användningen av en punkt nedan har en liknande effekt som den indologiska praxis att skilja retroflexkonsonanter med en punkt nedan, men det finns subtila skillnader - det är transliterationerna av ธ tho thong och ศ so sala som är prickade nedan, inte de av motsvarande retroflexkonsonanter . Transkriberingar av konsonanter ska anges i ordningsbasbokstaven, makron om någon, och sedan prickar nedan, horn eller "makron nedan".

Endast tre konsonanter har hornet i sin translitteration, ฅ kho khon , ฒ tho phuthao och ษ so ruesi , och bara en konsonant har en understrykning, ฑ tho nang montho .

Vokaler

Thai - ั  ำ - ิ - ี - ึ - ื - ุ - ู ฤๅ ฦๅ
ISO a ā å i ī ụ̄ u ū e æ o ı v ł łɨ y w x

Bokstaven å är det enda förkomponerade tecknet som anges i omskrivningen.

Lakkhangyao (ๅ) har endast visats i kombination med vokalbokstäverna ฤ och ฦ. Standarden listar helt enkelt ฤ och ฦ med konsonanterna och lakkhangyao med vokalerna. En isolerad lakkhangyao skulle också översättas med en liten bokstav "i" med stroke ( ɨ ), men sådant bör inte förekomma på thailändska, pali eller sanskrit.

Translitterationerna av ว wo waen och อ o ang har inkluderats här på grund av deras användning som kompletta vokalsymboler, men deras translitterering beror inte på hur de används och standarden listar helt enkelt dem med konsonanterna.

Förenade vokalsymboler translittereras i enlighet med deras beståndsdelar.

Andra kombinerande märken

Thai - ่ - ้ - ๊ - ๋ - ็ - ์ - ๎ - ํ - ฺ
ISO - - - –̌ –̆ –̒ ~ –̊ –̥

Observera att yamakkan (- ๎) representeras av en avstånds-tilde, inte en superscript-tilde.

Punktering och siffror

Thai
ISO « ǂ § ǀ ǁ » 0 1 2 3 4 5 6 7 8 9

ISO 11940: 1998 skiljer förkortningssymbolen paiyannoi (ฯ) från meningen terminator angkhandiao (ฯ), trots att varken den nationella karaktärsstandarden TIS 620-2533 eller Unicode version 5.0 skiljer dem. Paiyannoi är translitererad som ǂ och angkhandiao är translitererad som ǀ . Observera att paiyannoi , angkhandiao och angkhankhu (๚) transliteras av bokstäverna som används för klickkonsonanter , inte av dubbel dolk, vertikala staplar eller dandor .

Teckenföljd

I allmänhet translitereras tecken från vänster till höger och där tecken har samma horisontella position, uppifrån och ned. Den vertikala sekvensen är i själva verket helt enkelt specificerad som tonmärken och thanthakhat (- ์) före alla andra märken ovanför eller under konsonanten. Standarden förnekar i slutet av avsnitt 4.2 att kombinationen av sara u (◌ ุ, ◌ ู) och nikkhahit (◌ ํ) kan förekomma och ger sedan ett exempel på det när man anger translitterationen av nikkhahit , men visar inte translitterationen av kombinationen. Effekten av dessa regler är att, förutom nikkhahit , är alla icke-vokalmärken fästa vid en konsonant på thailändska fästa vid konsonanten i den romerska translitterationen.

Standarden medger att försök att transponera förutbestämda vokaler och konsonanter kan vara tröstande för dem som är vana vid det romerska alfabetet , men rekommenderar att förutbestämda vokaler inte transponeras.

Till exempel bör ภาษา ไทย ( RTGS Phasa Thai ) translittereras till p̣hās̛̄āịthy och เชียงใหม่ ( RTGS Chiang Mai ) till echīyngıh̄m̀ .

Variationer

Orsaker

Standarden anger i vilken ordning accenterna ska skrivas, men inte alla ingångssystem registrerar accenter i den ordning de skrivs in. Unicode anger två normaliserade formulär för bokstäver med flera accenter, och det är mycket troligt att translittererad text kommer att lagras i någon av dessa former. Detta komplicerar automatisk bakre translitterering. Eftersom Unicode-kompatibla processer måste hantera sådana variationer korrekt, har transliterationerna på denna sida valts för att underlätta visningen - dagens rendering-system kan visa motsvarande former på olika sätt.

Många teckensnitt visar nya kombinationer av konsonanter och accenter dåligt. Till exempel publicerar institutet för estniska språket en förklaring av tillämpningen av standarden på thailändska på nätet, och med ett undantag verkar detta vara en överensstämmelse med standarden. Undantaget är att, förutom makronen, accenter över konsonanter faktiskt är förskjutna till höger, vilket ger intryck av att de har skrivits in som motsvarande icke-kombinerande tecken. Standarden specificerar translitterationerna i kodpunkter, men någon som arbetar utifrån denna fria förklaring kan lätt dra slutsatsen att avståndsformerna för tonaccenterna ska användas.

ICU (CLDR 1.4.1)

Den ICU genomförande, inspelad i version 1.4.1 av gemensamma språk Data Repository sponsras av Unicode använder ett utmärkt stället för ett horn i transkribering av konsonanter. Detta påverkar translitterationen av ฅ kho khon , ฒ tho phuthao och ษ so bo ruesi . ฏ till patak translitereras också annorlunda, som snarare än .

Denna implementering translitererar ำ som  istället för å för att undvika tvetydighet med den hypotetiska thailändska skriptsekvensen ะํ ( sara a , nikkhahit ). ICU-implementeringen translitererar ฺ phinthu som ˌ istället för att undvika problem med Unicode- normalisering. Detta har en bieffekt av att förbättra läsbarheten när den appliceras på en undermönstrad konsonant.

ICU-implementeringen translitererar ฯ paiyannoi som (dubbel dolk) och angkhankhu som || (två ASCII vertikala staplar). Eftersom ICU-implementeringen använder Unicode kan den inte på ett tillförlitligt sätt skilja angkhandiao från paiyannoi utan en semantisk analys och gör inget sådant försök.

Teckensekvensen för ICU-implementeringen är annorlunda. Den transponerar förutbestämda vokaler med följande konsonant och bearbetar märkena på en konsonant i den ordning de lagras i minnet. (De flesta thailändska inmatningsmetoder säkerställer att märkena lagras i botten till toppordning.) Det transponerar inte förutbestämda vokaler med kompletta konsonantkluster; konsonantkluster kan inte identifieras med fullständig noggrannhet och att transponera vokaler med kluster skulle kräva en extra symbol för att tillåta tillförlitlig konvertering tillbaka till det thailändska skriptet.

Till exempel, under denna implementering translitererar ภาษา ไทย till p̣hās̄ʹāthịy och เชียงใหม่ till cheīyngh̄ım̀ .

Slutligen genererar denna implementering translitterationer i Unicode Normalization Form C (NFC).

Se även

Referenser

externa länkar