Por fin algo de luz sobre internacionalización. Había intentado unas cuantas veces aprender sobre el tema, pero todos los articulos y tutoriales que leía era bastante confusos.
Este artículo me ha encantado por lo claro que es. Podrías hacer además un artículo sobre como manejar los distintos idiomas y codificaciones en Python.
Impresionante el artículo, felicidades. Intenté pasar una vez a UTF-8 desde ISO-8859-15 pero me daba problemas precisamente el BOM y los editores de Windows. Se resolvió cambiando a Ubuntu.
Lo de Ken Thompson y Rob Pike inventando el UTF-8 es una historia muy interesante; el sistema se diseñó prácticamente desde cero en una cena, y se implementó en el código fuente de Plan 9 en un par de días. Amigo, esto si que es ser auténticos hackers. Se comprende que los dos sean leyendas.
"Por último, es interesante saber que no basta con conocer el carácter que se le quiere mostrar al usuario para saber que grafía (en inglés, el glyph) hay que mostrar en pantalla."
y aqui me has dejado con la duda. y como se supone que arreglan esto?. metiendo mas caracteres (en plan bestia), o se encarga el propio navegador de cambiar el caracter por el contexto (creo que esto seria un poco pesado para el navegador).
lo que queda claro que segun se vaya escribiendo (por da un ejemplo) se tiene que revisar el contexto para ver si hay que colocar en pantalla, o como segunda opcion se le deja al que escribe que el mismo coloque la opcion que crea conveniente (lo que puede necesitar un teclado mas grande o que utilice teclas de control para introducir ciertos caracteres).
p.d.: no he puesto acentos por esto de que todo se codifique en ascii sin problemas ;)
para saber que grafia hay que mostrar, el navegador tiene que conocer en que idioma esta el texto, no solo el codepoint. Esto es en teoria, como digo los navegadores hoy en dia no usan esta informacion.
En la practica, el usuario tiene instalada una fuente que tiene la grafia a la que esta acostumbrado, asi que las fuentes chinas y japonesas son distintas, a pesar de cubrir los mismos codepoints en los alfabetos hanzi y kanji.
El problema surge cuando se intenta leer una pagina en japones usando un ordenador en chino. En lugar de aparecer las grafias tipicas del japones salen las del chino. Hasta que los navegadores no arreglen este problema, no hay nada que se pueda hacer.
¡Genial!
ReplyDeleteEl mejor artículo que he leído sobre la Internacionalización, sobre todo el más claro, preciso y sobre todo profesional.
Gracias y enhorabuena
P.D. Estaré esperando la segunda parte.
Por fin algo de luz sobre internacionalización. Había intentado unas cuantas veces aprender sobre el tema, pero todos los articulos y tutoriales que leía era bastante confusos.
ReplyDeleteEste artículo me ha encantado por lo claro que es. Podrías hacer además un artículo sobre como manejar los distintos idiomas y codificaciones en Python.
Un saludo
Impresionante el artículo, felicidades. Intenté pasar una vez a UTF-8 desde ISO-8859-15 pero me daba problemas precisamente el BOM y los editores de Windows. Se resolvió cambiando a Ubuntu.
ReplyDeleteLo de Ken Thompson y Rob Pike inventando el UTF-8 es una historia muy interesante; el sistema se diseñó prácticamente desde cero en una cena, y se implementó en el código fuente de Plan 9 en un par de días. Amigo, esto si que es ser auténticos hackers. Se comprende que los dos sean leyendas.
Si alguien quiere más trasfondo histórico, aquí hablan del asunto, entre otros, el propio Rob Pike: http://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt
Genial el artículo, enhorabuena! esperando la continuación para meternos en harina :)
ReplyDeleteY por cierto, menudas oficinas, envidia no es la palabra...
Muy buen artículo, ahora a esperar la segunda parte.
ReplyDeleteLástima que cuando haya leído las dos partes, seguiré sin saber aplicarlo, pero sabré lo que no aplico.
"Por último, es interesante saber que no basta con conocer el carácter que se le quiere mostrar al usuario para saber que grafía (en inglés, el glyph) hay que mostrar en pantalla."
ReplyDeletey aqui me has dejado con la duda. y como se supone que arreglan esto?. metiendo mas caracteres (en plan bestia), o se encarga el propio navegador de cambiar el caracter por el contexto (creo que esto seria un poco pesado para el navegador).
lo que queda claro que segun se vaya escribiendo (por da un ejemplo) se tiene que revisar el contexto para ver si hay que colocar en pantalla, o como segunda opcion se le deja al que escribe que el mismo coloque la opcion que crea conveniente (lo que puede necesitar un teclado mas grande o que utilice teclas de control para introducir ciertos caracteres).
p.d.: no he puesto acentos por esto de que todo se codifique en ascii sin problemas ;)
Hola vainas,
ReplyDeletepara saber que grafia hay que mostrar, el navegador tiene que conocer en que idioma esta el texto, no solo el codepoint. Esto es en teoria, como digo los navegadores hoy en dia no usan esta informacion.
En la practica, el usuario tiene instalada una fuente que tiene la grafia a la que esta acostumbrado, asi que las fuentes chinas y japonesas son distintas, a pesar de cubrir los mismos codepoints en los alfabetos hanzi y kanji.
El problema surge cuando se intenta leer una pagina en japones usando un ordenador en chino. En lugar de aparecer las grafias tipicas del japones salen las del chino. Hasta que los navegadores no arreglen este problema, no hay nada que se pueda hacer.
Un saludo!
童裝批發
ReplyDelete童裝
童裝
酒店喝酒
暑假打工
寒假打工
酒店
酒店經紀人
酒店現領
酒店經紀爆米花
酒店上班PRETTY GIRL
酒店小姐
酒店兼職
禮服店
酒店經紀
酒店兼差
酒店打工
酒店上班
假日打工
台北酒店經紀
童裝批發