1. LaTeX y el japonés
Todos los libertonianos conocemos las bondades de esta herramienta de
preparación de documentos (igual que estamos convencidos de que
Mandrake va camino de la dominación mundial y de que KDE y Drupal
son lo mejor que ha inventado la humanidad desde el café con leche).
LaTeX es adecuado especialmente para la
creación de documentos de una extensión respetable y, por lo tanto, le viene
un poco grande al estudiante de japonés, que ya se puede sentir orgulloso si
es capaz de escribir un texto de doscientas palabras en un tiempo
razonable... Pero para que se vea que se puede (y que me sobra el tiempo
libre) os explico las formas de escribir kanji y kana con LaTeX.
1.1 Los requisitos previos
Lo primero que necesitamos es un editor de texto en el que podamos escribir los
documentos de entrada de LaTeX, es decir, un editor que permita usar codificación
JIS ("Japanese Industrial Standard" publicado por la JSA, los equivalentes a los americanos ASCII y ANSI) o EUC ("Extended Unix Code") o bien UTF-8, mostrando correctamente lo que vamos escribiendo.
Las vacas sagradas (Vim y X/Emacs) no incluyen un soporte de fuentes apropiado y no nos servirán de primeras pero lo harán si usamos el Mule o el
vim-jp (japonés) (página en japonés sin traducción alternativa) o quizás Gnome-Vim, si realmente usase Pango (aunque no lo he probado, dudo que lo haga).
Otros editores de KDE (incluido Kile) o basados en GTK2 y Pango
funcionarán sin problemas. Por desgracia, a LyX aún le falta un hervor porque, aunque las últimas versiones usan Qt, no admite entrada vía kinput2, no muestra las fuentes correctamente (no usa el motor de Qt para ello) y no tiene en una entrada JIS o similar en el cuadro de selección de la codificación del documento, tal y como mencionaba en "Linux y la lengua japonesa".
El japonés tradicionalmente se escribe de derecha a izquierda y de arriba a bajo,
en columnas. Esto ya plantea un problema para la mayoría de los procesadores de
texto convencionales: no es demasiado grave porque también es muy
habitual ver textos en japonés escritos "de la manera occidental" (de izquierda
a derecha, en renglones) pero es molesto que no te den la opción. LaTeX, como separa
contenido del documento final, hace muy fácil utilizar en los documentos de salida
formas "no estadounidenses" de escritura, tanto para lenguas actuales como el japonés o el
árabe (de derecha a izquierda en renglones) como lenguas más "especiales": por ejemplo los
jeroglífico e hierático o el akadio (un
ejemplo curioso del soporte en LaTeX de lenguas arcaicas (PS)). La idea es escribir
de la forma occidental con nuestro editor habitual y dejar a LaTeX que componga correctamente la salida, verticalmente de derecha a izquierda o bien en reglones de izquierda a derecha.
1.2 Manos a la obra: teTeX
La distribución de TeX más popular en Linux (y en Unix en general) es
teTeX y ésta incluye de serie los paquetes pTeX y pLaTeX
para la composición de documentos japoneses. El modo de utilización de estos paquetes es sencillo, si bien la documentación que se incluye está íntegramente en japonés.
En el paquete pLaTeX encontramos las clases "jarticle" y "tarticle", "pbook" y "tbook" y
"jreport" y "treport", equivalentes a las habituales "article", "book" y "report". Las que
comienzan con "t" indican escritura vertical tradicional y las que empiezan con "j" escritura
en renglones. Se añaden además tipos de papel habituales en Japón y adaptaciones como el "a4j".
Un documento pLaTeX de entrada está codificado en JIS-7 (JIS de 7 bits por carácter, no hay que definir ningún inputenc especial) y su clase es una de las anteriores: por lo demás es idéntico a otro documento LaTeX que podamos escribir. No obstante, el procesamiento es ligeramente diferente.
1.2.1 Las órdenes platex, pxdvi y pdvips
Para procesar un documento pLaTeX se usan las herramientas especiales
platex, pxdvi y/o pdvips (antiguo dvipsk), incluidas con pTeX.
La sintáxis de éstas es la misma que sus homónimas estándar sin "p". Una vez obtenido el *.ps,
podemos obtener el documento PDF de la forma habitual con ps2pdf. pTeX no
incluye sustituto para pdflatex.
Como ejemplito para ver como se trabaja con pLaTeX usaremos esta
transcripción TeX del poema Iroha, usando la clase "jarticle" y "tarticle".
Como nota al margen, el poema Iroha es el texto japonés más antiguo que se conserva
y se usa como índice en algunos diccionarios (por si alguien se preguntaba cómo se organiza
un diccionario de una lengua que no tiene alfabeto) y en CSS es un tipo válido para listas de
elementos ordenados (también podemos escribir en vertical en XHTML, pero esa es
otra historia). Para más información, consultad Iroha en la Wikipedia
$ platex iroha.tex
$ pdvips iroha.dvi -o iroha.ps
$ ps2pdf iroha.ps
... Y aquí podemos ver el resultado (observesé la fecha en japonés, justo después del título como varía de la forma tradicional en vertical a la forma moderna cuando escribimos en horizontal):
La ventaja de pLaTeX es que los documentos de entrada no se diferencian de los documentos de entrada escritos en inglés o español, salvo por la pequeña diferencia en el nombre de las
clases de documentos. No hay que usar paquetes especiales. También
pLaTeX se integra facilmente con CJK-LyX. Las pegas que tiene desde el punto de vista del estudiante hispano son:
- Únicamente se procesan documentos codificados en JIS-7. Si bien JIS-7
incluye todos los caracteres ASCII-7, no incluye los caracteres extendidos como la "ñ" o los
acentos, haciendo incómodo escribir documentos mixtos español-japonés (por ejemplo, hay que recurrir al viejo "\'{vocal}").
- No viene macros para manejar furigana de serie, aunque buscando por la Red encontramos un completo estilo escrito por
Shinsaku Fujita (japonés) para usar furigana en pLaTeX (furikana.sty), junto con otros añadidos interesantes
- La documentación oficial y el 99.999% de lo que podemos encontrar por ahí sólo está en japonés: configurar cosas como que se empleen bonitas fuentes TrueType como kochi-mincho en vez de las bitmap puede ser una odisea si no nos manejamos a ese nivel con el LaTeX de siempre.
Por completar, baste decir que para escribir japonés en LaTeX también podemos usar la alternativa CJK-LaTeX, de filosofía distinta: usa las
mismas herramientas de siempre pero hay que incluir paquetes adicionales en los documentos. Hay una guía muy sencillota que explica pasito a pasito cómo combinar CJK-LaTeX con el modo de entrada UTF-8 en teTeX, usando la fuente TrueType Unicode Cyberbit que se distribuye sin coste y que es más ligera y más modesta que la enorme MS Arial Unicode:
"How to make LaTeX (teTeX)
handle unicode and CJK in MacOSX". Aunque tenga ese "MacOS X" en el nombre, es aplicable a cualquier teTeX teniendo un poco de vista al tratar los nombres de los directorios. Esta solución funciona igual de bien, al menos, que pLaTeX y supongo que elegir entre una y otra es cuestión de gustos. Tampoco son excluyentes: puedes tener ambos y usar la notación furigana de CJK-LaTeX en un jarticle, por ejemplo
2. Los diccionarios Jim Breen de la universidad de Monash: EDICT, KANJIDIC y más
Jim Breen de la universidad de Monash (Australia) fundó y mantiene el proyecto colaborativo
EDICT: un diccionario japonés-inglés cuya licencia permite la redistribución y la modificación, siempre que no haya ánimo de lucro, se dé crédito al proyecto y las versiones modificadas aparezcan como tales y bajo la misma licencia que el original.
El proyecto EDICT es espectacular: estamos hablando de un diccionario básico de unas
100.000 entradas, con diccionarios complementarios como, por ejemplo, el glosario de términos legales japonés-inglés de la universidad de Washington, uno específico de términos de ingeniería, de lugares, de nombres de personas, etc. Jim Breen tambión mantiene
KANJIDIC:
un diccionario de kanji con unas 6.350 entradas. Todo ello accesible en el
"The Monash Nihongo ftp Archive"
Sin embargo, estos diccionarios no son más que archivos de texto con el término, su acepción en inglés y algunos campos informativos adicionales como por ejemplo el grado en el diccionario de kanji. Hace falta un programa que nos permita hacer las consultas sobre ellos: búsquedas de kanji por número de trazos, radicales, etc. Generar tests de aprendizaje a partir de terminos seleccionados... En torno a EDICT han surgido muchos proyectos para múltiples plataformas, entre ellas Linux.
Podemos consultar on-line los diccionarios EDICT en muchas páginas. Una de mis preferidas
es Nihongoresources que, aparte de los diccionarios, tiene apuntes de gramática, links y una sección muy maja con gifs animados que te enseñan a escribir los jôyô kanji hasta grado 3.
Ahora pasamos a comentar algunos de los programas libres que manejan ese diccionario
2.1 Para los mayores
2.1.1 Gjiten
Gjiten es un interfaz de diccionario muy básica para EDICT y KANJIDIC escrita para GNOME2. No es más que eso: un diccionario. Necesita de algún método de entrada que nos permita escribir en japonés (como el XIM/kinput2 o im-ja, ambos mencionados en "Linux y la lengua japonesa") y la conversión manual vía iconv de EUC-JP a Unicode (UTF-8) de EDICT y KANJIDIC.
2.1.2 Kiten
Kiten es la versión KDE del anterior. más completo: incluye su propio método de entrada en japonés, con lo que no es necesario configurar nada más para usarlo si no queremos. Entiende diccionarios codificados de muchas formas distintas, el interfaz está traducido al castellano, deinflexiona verbos y dispone de funciones de aprendizaje de kanji muy prácticas. Navegar por los resultados es muy cómodo, con búsquedas restringidas y un entorno parecido a un navegador web. Es una herramienta "todo en uno" para el estudiante de japonés. La única pega es que el cuadro de entrada de búsquedas es pequeño y no es funcional con las fuentes bitmap que se instalan por defecto con las X (sobre todo los kanji es imposible distinguirlos), siendo necesario instalar fuentes TrueType.
Y hablando de fuentes, ojo los usuarios de Debian: al parecer la versión de
KDE 3.1 de esa distribución (la que viene en Sid y la única en Debian con la que puede correr Kiten) no muestra correctamente las fuentes japonesas si está activo el anti-alias. Esto es no ocurre ni en Mandrake ni en RedHat por lo que he podido comprobar y no tengo muy claro el por qué. Gjiten en Sid, usando Pango y GTK2, las muestra correctamente.
2.1.3 JGloss
JGLoss es un editor GPL escrito en java que
añade furigana y traducción de los kanji al texto que japonés que carguemos. El editor elige la
primera lectura y acepción de KANJIDIC (si la encuentra) y la añade al kanji usando un
resaltado de colores, muestra el resto en un panel auxiliar y deja luego que el usuario haga
los ajustes a mano (elija la lectura kun o on correcta de ese kanji, por ejemplo). Es
muy útil para hacer traducciones, pero que nadie se llame a engaño, que no es un traductor
automático ni mucho menos.
El texto anotado puede exportarlo a CJK-LaTeX, pLaTeX y HTML con
notación ruby (actualmente sólo MS IExplorer soporta ese estándar, aunque se espera que Mozilla lo soporte a corto o medio plazo).
2.1.4 Moji
Moji es una extensión sencilla para Mozilla Firebird
(ojo: exclusivamente para Firebird). Integra los diccionarios con el navegador, con lo que si
estamos leyendo una página japonesa y no entendemos tal o cual palabra o kanji, podemos consultarla directa y localmente. Usa EDICT y KANJIDIC convertidos de EUC-JP a UTF-8.
2.2 Para los pequeños
Aquí damos un repaso al software para PalmOS y Windows Mobile, con el que convertir nuestra agenda de mano en un diccionario electrónico japonés-inglés bastante completo. Hay que mencionar que un diccionario electrónico convencional japonés-inglés (una maquinita dedicada) sale bastante caro al cambio, no se venden en Europa que yo sepa y, a menos que compres alguno en Estados Unidos, vienen con los manuales y el interfaz en japonés porque están pensados para estudiantes japoneses que se van al extranjero. Muchos son verdaderas bibliotecas andantes con decenas (literalmente) de diccionarios cargados en memoria y EDICT no se puede comparar seriamente con ellos, pero EDICT es gratis y una Palm o un Pocket PC es infinitamente más versátil, más fácil de obtener por estos lares y, si me apuras, más barato que esos diccionarios electrónicos.
2.2.1 JWPce
De éste ya he hablado antes. JWPce,
escrito por el profesor del dpto. de física de la UCLA Glenn Rosenthal,
es un editor de japonés para Windows bajo licencia GPL que tiene, además, versión para Windows CE. El interfaz de la versión para Pocket es completísimo y no desmerece en nada del de la versión para PC. De hecho, es de lo mejor que he visto en Pocket PC. JWPce hace de interfaz con los diccionarios EDICT, KANJIDIC y allegados, permite búsquedas por radicales, número de trazos y demás editar textos japoneses sin necesidad de instalar las extensiones para lenguas asiáticas de Microsoft para Windows CE. La instalación es muy sencilla y puede leer los diccionarios de una tarjeta de expansión.
2.2.2 MJDICT y JPenSIP
"Japanese Input and Dictionary for Pocket PC". Otro propograma GPL para Pocket PC y Windows CE. Un interfaz de EDICT para Pocket más un módulo de entrada japonesa con reconocimiento de escritura que se integra con Windows CE. Basado en KanjiPad, que a su vez está basado en el Jstroke (¿no es maravilloso el soft libre?).
2.2.3 PADict
Aquí donde me veis, soy un contento propietario de una Palm m105, modelo idéntico al m100 salvo por las ocho megas con las que cuenta, y éste es el software que utilizo como diccionario de japonés cuando estoy lejos de mi PC de sobremesa.
PADict es excelente, sobre todo en su versión de desarrollo. No requiere las extensiones CJKOS de entrada japonesa para PalmOS (que son de pago :-(), incluye reconocimiento de escritura (integra
PocketKanji, que a su vez está basado en KanjiPad, que a su vez... :-)) para kanji, hiragana, katakana, búsquedas por radicales, por números de trazo, entrenador de vocabulario, busqueda en romaji, etc. Para colmo, las búsquedas
son increiblemente rápidas si tenemos en cuenta las limitaciones del bicho, ocupa casi 4,5 megas (3,5 son los diccionarios si optamos por versiones "completas" de EDICT y de KANJIDIC).
El único punto negro es que no soporta aún diccionarios en tarjetas de memoria externas.
2.2.4 PalmWac
De acuerdo, no tiene mucho que ver con el japonés pero a lo mejor en alguna ocasión es
útil. PalmWac convierte nuestra Palm en una tableta Wacom "para pobres" y así es un poco más fácil usar programas de reconocimientos de trazos como KanjiPad. Ahí van un par de capturas de KanjiPad escribiendo con PalmWac (vale sí: tengo un pulso horrible :-)).
De todas formas, por muy "feo" que escribamos con el ratón, KanjiPad reconoce casi siempre a la primera el kanji que queríamos dibujar así que PalmWac la añado más que nada como una aplicación curiosa :-).
3 Despedida y cierre
¿Hay algún otro libertoniano que estudie japonés?. ¿Nadie?, ¿ni siquiera que haya pensado ponerse?, jo :-)...
¿Qué otras herramientas para el aprendizaje de idiomas, se cualquier idioma, conocéis que sean software libre y habéis usado alguna vez?.