Internacionalizácia, lokalizácia, kódovanie, Island a preklad webových stránok s japonskými mačkami
Existuje veľa informácií, pokiaľ ide o internacionalizáciu, lokalizáciu a kódovanie vo webových aplikáciách. Existuje tiež veľa nedorozumení v súvislosti s tým, čo každý z nich poskytuje pre webovú aplikáciu. Tu je môj názor ...
Keď webový prehľadávač vytvorí spojenie s webovým serverom, odovzdá niekoľko premenných a urobí ďalšie požiadavky, tu je príklad:
GET / HTTP / 1.1
Hostiteľ: www.dknewmedia.com
User-Agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Prijať: HTTP Accept = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, obrázok / png, * / *; q = 0.5
Jazyk prijatia: en-us, en; q = 0.5
Accept-Encoding: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Internacionalizácia
Internacionalizácia je zložená z mnohých vecí:
- lokalizácia: Schopnosť identifikovať, z akého jazyka a miesta návštevník prichádza. To sa deje prostredníctvom požiadaviek HTTP, kde je návštevník identifikovaný podľa miestneho nastavenia. V mojom prípade je to en-US. „En“ je angličtina a „US“ sú Spojené štáty americké. Toto je nastavenie v mojom operačnom systéme.
- Časové pásma: Schopnosť prispôsobiť sa časovým pásmam. To sa zvyčajne dosiahne nastavením servera na greenwichský stredný čas (GMT) a potom umožnením používateľom nastaviť miestne posunutie od GMT.
- Kódovanie znakov: Toto je schopnosť správne zobraziť znakové sady jazyka. Líši sa to od lokalizácie, pretože lokalizácia mi môže povedať jazyk a oblasť počítača, z ktorého sa podáva požiadavka, ale nehovorí mi, v akom jazyku je čitateľ žiada ... to je na čitateľovi!
Všimnite si v mojom hlavičke HTTP, keď prehliadač urobil požiadavku, a povedal serveru, že požaduje moje miestne nastavenie (Accept-Language: en-us); musí však tiež serveru povedať, aká znaková sada sa požaduje (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 a utf -8 sú obidve prípustné sady znakov.
Lokalizácia
V tomto fantastickom zmiešanom svete už lokalizácia nikdy nediktuje jazyk. Aj keď som v en-USA, dokážem absolútne čítať iný jazyk pomocou inej znakovej sady ... to sa stane, keď používam Google hindčina (Google Hindi skutočne nepoužívam). Moja žiadosť o miestne nastavenie a znakovú sadu sú identické s požiadavkami Google anglicky stránka, ale v skutočnosti sa mi zobrazuje stránka, ktorú nemôžem prečítať, pretože nemám znakovú sadu. Všetko sa objaví ?????????? ... Túto znakovú sadu však môžem načítať do Firefoxu (Firefox> Predvoľby> Pokročilé> Jazyky):
Ak načítam tento jazyk, môžem požiadať o stránku v jej natívnej znakovej sade a zobraziť ju v počítači, aj keď je moje predvolené miestne nastavenie en-US!
Takže ... ak som študent hindčiny, študujem angličtinu na Purdue a spojím sa cez VPN na školský server, na dovolenke v Austrálii ... na to, aby bola aplikácia skutočne internacionalizovaná, je potrebné použiť 3 rôzne nastavenia nikto záleží na druhom.
Moje miestne nastavenie bude en-US, ale moje časové pásmo je Austrália, ale jazyk, ktorý požadujem z tohto webu, môže byť hindčina. Keby som mal naprogramovať svoju prihlášku na výrobu predpoklady na základe miestnych nastavení môjho počítača by som sa úplne mýlil - kŕmenie osoby angličtinou vo východnom časovom pásme. V ideálnom prípade by som svoju aplikáciu naprogramoval tak, aby ponúkala oba nastavenie jazyka a časovej zóny ... ale nepredpokladal by som ich na základe miestneho nastavenia.
Island - vrcholný príklad
Nevieme o výzvach viacerých jazykov a jazykov v Spojených štátoch, kde sa nachádzame všetko hovorte anglicky [implikovaný sarkazmus]. V niektorých krajinách, napríklad na Islande, aj keď rodným jazykom je islandčina, neuveriteľní obyvatelia Islandu vyrastajú a učia sa 3 jazyky! Pretože Island je krajina v strede Európy a Severnej Ameriky, ich spoločnosti pracujú na viacerých kontinentoch, jazykoch, dialektoch jazykov a viacerých časových pásmach z ich pracovnej plochy!
Mnoho islandských webových stránok je vytvorených v americkej angličtine, angličtine vo Veľkej Británii, islandčine, španielčine, španielčine, francúzštine a nemčine! Len si predstavte, aké náročné by bolo stavať Icelandair webové aplikácie a systémy predaja cestovných lístkov ... wow!
Zrieknutie sa zodpovednosti: Mal som absolútne potešenie pracovať s vynikajúcimi ľuďmi z Icelandair a môžem vám povedať, že sú jedni z najtalentovanejších a najprívetivejších profesionálov, s ktorými som mal to potešenie pracovať. Je to jednoducho úžasná krajina a ľudia! Choďte na návštevu ... zaveďte Islandair a určite navštívte Blue Lagoon!
Jazyk verzus kódovanie
V jednom jazyku existujú dokonca rôzne kódovania znakov, ktoré sa navzájom veľmi nehrajú! Príklad: Japonský e-mail napísaný v Shift-JIS sa môže na počítači japonskej osoby s lokalizáciou nastavenou na ja-JP stať nečitateľný, pretože jeho poštový server rozpoznáva iba EUC-JP. V ideálnom prípade by mal byť zákazník schopný nastaviť, aké kódovanie by chcel, a aký jazyk - jednoducho by sa mal ubezpečiť, že kódovanie a jazyk sú kompatibilné s tým, čo požaduje klient.
Ak si chcem prečítať japončinu, možno bude potrebné zvoliť pre kódovanie japončinu ako jazyk AND Shift-JIS, aby sa tento jazyk zobrazil správne. Do mixu je potrebné pridať ďalšie nejasnosti ... niektoré typy kódovania podporujú niekoľko jazykov. UNICODE / UTF8 podporuje desiatky. Platí to aj naopak. Niektoré jazyky je možné čítať v mnohých typoch kódovania. Ak to nedáva zmysel ... ospravedlňujem sa, je to veľmi zložitá otázka.
Jedného dňa verím (dúfam), že sa to všetko zmení. Myslím si, že pôvodní dizajnéri lokalizačných kódov dúfali, že bude stačiť iba kombinácia jazyka a krajiny ... ale my sme sa stali oveľa sofistikovanejšími. Pamätajte, že veľa z toho bolo vyvinuté ešte predtým, ako existoval internet. S príchodom GIS, možno si človek môže zvoliť svoje kódovanie a GIS by spracoval časové pásmo a miestne informácie.
Internacionalizácia
Späť na podporu internacionalizácie. Ak chcete poskytnúť internacionalizovanú aplikáciu, musíte:
- Podpora viacerých typov kódovania, jazykov a prekladových súborov na zobrazenie týchto prekladov.
- Umožnite klientovi nastaviť svoj jazyk a prípadne aj typ kódovania, ak je to potrebné.
- Podporujte časové pásma tým, že používateľom umožníte odkazovať na svoje časové pásmo v porovnaní s GMT.
- Používajte lokalizačné kódy opatrne ... NEPRESNE zobrazujú to, čo váš používateľ vlastne požaduje, ani čo môže čítať.
preklad
Strojový preklad je ešte len v začiatkoch. Existuje množstvo webových stránok (a WordPress pluginy), ktoré ponúkajú strojový preklad vašich stránok. Nenechajte sa zlákať k tomu ... existujú dva dôvody, prečo:
- Ak funguje strojový preklad, používateľ, ktorý kontroluje vaše stránky, už bude mať prekladateľa, s ktorým bude pracovať.
- Strojový preklad je na hovno.
Neverte mi? Tu je pre vás japonský preklad:
Prilepené z Súbor Masatsu - vole s kopou obrázkov mačiek:
Japonský vstup do blogu
???????????
- 00:29:35 od Masatsu?????????????????????????????
?????????????????????????????????????? (?)?
????????????????????????????????????????
????????????????????????????????????????????????????????????????????? (?)
?????????????????
??????????????
???????????
??????????????????????????????????????????????????
???????????????????????????????
?????????????????????????????????????????
?????????????????????????????????????
?????????? Ag ???????????????????????????????????????????????????????
Strojový preklad:
?? Hann????
-00: 29: 35 od MasatsuMeno prvého svätca / slona, ktorý sa objavil na včerajšej „flotile päste“ a / šelmy ?? ranger “„ ?? Hann ???? “ s / rozhlasovým hercom Yutaka Mizushima….
? (?) Čo robí sépie ľahko.
Pretože aj rozhlasový herec prvého svätca, pán ????? z / mačky sú čínski kdoule Nagai Ichiro = dračia guľa, štáb a / alebo ?? ranger vyzerá ako ľudia, ktorí vtipné poznámky ľahko vedia.
?????? (Pot), na ktorý som tento rok úplne zabudol „tajomstvo názvu super flotily“, obvyklá prax každý rok?,
?????? Ak tento rok napíšem oneskorene,
??????? svätyňa ??? (môže ako?)? ostroha na ostrohu (?? rez nie) Fukami ?? (? alebo pozorovať schopný?) je to to, čo robí
?????? S, stane sa „plechovkou /? /?“, Inými slovami „kung fu“, keď sa zoradí a zmení hlavu názvu /.
?????? Aj keď sa hovorí, že údajne pribúdajú ďalšie dva, môže sa stať, aký druh mena.
Pravda je vraj „vek“, pretože symbolom strieborného prvku je Ag?, Hoci názov „the ???? striebro “Takaoka? technik ??????? myslel si, že postava volá „?“ bol použitý s asociáciou filmu silver'screen ?, ak ho volá s prídavným členom.
?????? Myslím si však sebecky, že moja teória nesúvisí s tým, že „?“ je súčasťou / čínskeho znaku.
Som si istý, že obrátenie polarity tohto prekladu by poskytlo rovnako čitateľnú dikciu v angličtine. Rozumeli ste vstupu, že?