Skip to content

Commit

Permalink
Update hyphenation files
Browse files Browse the repository at this point in the history
This commit adds all hyphenation files from LibreOffice as located in
https://github.com/LibreOffice/dictionaries.

Additionally a script is added to the tools-directory to download the
ZIP-file of the LibreOffice dictionaries and update the dictionaries
based on any new release. This should ease retrieval of new or updated
hyphenation-dictionaries.

The script can be invoked via
`./tools/updateHyphenationFilesFromLibreOffice.sh` and hanles everything
else from there. The files need to be added to git manually afterwards.
  • Loading branch information
heiglandreas committed Jun 11, 2020
1 parent 68489ee commit 1abd1c2
Show file tree
Hide file tree
Showing 61 changed files with 564,417 additions and 20,312 deletions.
79 changes: 79 additions & 0 deletions src/share/files/dictionaries/README_hyph_bg_BG.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,79 @@
Това е пакет за сричкопренасяне за OpenOffice.org. Може
да свалите OpenOffice.org от http://openoffice.org/.
Пакетът се поддържа заедно с проекта bgOffice. За повече
информация, прочетете файла README.bgOffice, който идва с
този пакет или посетете страницата на проекта на адрес:
http://bgoffice.sourceforge.net.

bghyphen.tex -- TeX hyphenation patterns for Bulgarian
Copyright 2000 Anton Zinoviev <[email protected]>

Translation to ALTLinux hyphenator format (for use in
OpenOffice.org) July 2002 Borislav Mitev <[email protected]>



Указания за инсталиране и настройка


1. Копирате файла hyph_bg_BG.dic в директорията:

..\OpenOffice.org\share\dict\ooo

Ако сте инсталирали проверка на правописа на американски
английски, то в тази директория трябва да се намират файловете
en_US.aff, en_US.dic и dictionary.lst.


2. Отваряте файла dictionary.lst с текстов редактор и добавяте
следния ред на края му:

HYPH bg BG hyph_bg_BG


3. Стартирате OpenOffice и осъществявате следните настройки:
Tools/Options/Language Settings:
- В Languages/Default languages for documents трябва да се
посочи Bulgarian;
- В Writing Aids/Available language modules/Edit за
Language/Bulgarian трябва да се е появил под реда Hyphenation
нов ред с етикет ALTLinux LibHnj Hyphenator, който трябва да се
избере.


4. За да направи самото сричкопренасяне върху текста от
Tools/Hyphenation...
- По подразбиране сричкопренасянето е включено на ръчен режим,
т.е. ще пита за всяка една дума как да я пренесе, което за
големи текстове не много удобно. За да се пусне в автоматичен
трябва да се избере Hyphenate without inquiry от
Tools/Options/Language Settings/Writing Aids/Options;
- При повторно сричкопренасяне, което обикновено се налага при
промяна на текста или формата, тиретата остават на старите си
места и трябва да се махнат ръчно. Надявам се това да бъде
променено в по-следващите версии.


Всяка помощ е добра дошла. Търсят се доброволци да помагат.


OOo-hyph-bg
Авторски права (C) 2001 Антон Зиновиев <[email protected]>
Борислав Митев <[email protected]>
Поддържа се от Радостин Раднев <[email protected]>

Получавате тази програма БЕЗ КАКВИТО И ДА Е ГАРАНЦИИ. Това е
свободна програма и, ако желаете, можете да я разпространявате
при определени условия. За подробности прочетете файла
COPYING.BULGARIAN, който идва с този пакет.


OOo-hyph-bg
Copyright (C) 2001 Anton Zinoviev <[email protected]>
Borislav Mitev <[email protected]>
Maintained by Radostin Radnev <[email protected]>

This program comes with ABSOLUTELY NO WARRANTY. This is free
software, and you are welcome to redistribute it under certain
conditions. For details read file COPYING that comes with this
package.
16 changes: 16 additions & 0 deletions src/share/files/dictionaries/README_hyph_ca.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,16 @@
_______________________________________________________________________________

DICCIONARI DE PARTICIÓ DE MOTS
versió 1.3

Copyright (C) 2013-2015 Jaume Ortolà <[email protected]> --- Riurau Editors

Llicència (a la vostra elecció):
LGPL v. 3.0 o superior -- http://www.gnu.org/licenses/lgpl-3.0.html
GPL v.3.0 o superior -- http://www.gnu.org/licenses/gpl-3.0.html

Aquests patrons funcionen amb el LibreOffice i OpenOffice.org 3.2+

Més informació:
http://www.softcatala.org/wiki/Rebost:Diccionari_català_de_partició_de_mots
_______________________________________________________________________________
42 changes: 42 additions & 0 deletions src/share/files/dictionaries/README_hyph_de.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,42 @@
Hyphenation dictionary "hyph_de_DE.dic"
---------------------------------------

Language: German (de DE)
according to the reform of 2006-08-01 (i.e. reformed or new spelling)

Version: 2017-01-12
New: using the COMPOUND feature for improved hyphenation
New: list with over 69,000 words and compounds by Karl Zeiler

Origin: Based on the TeX hyphenation tables "dehyphn.tex", revision level 31.
http://www.ctan.org/tex-archive/language/hyphenation/dehyphn.tex
The TeX hyphenation tables are released under the LaTeX Project
Public License (LPPL)

License: OpenOffice.org Adaptions of this package are licensed under the
GNU Lesser General Public License (LGPL 2 or later) and are under
Copyright by

Author: conversion author: Marco Huggenberger <[email protected]>
revised conversion and extensions: Daniel Naber <[email protected]>
improvements: Karl Zeiler <[email protected]>

Note: This dictionary is based on syllable matching patterns
and thus should be suitable under other variations of German:
HYPH de AT hyph_de_AT
HYPH de CH hyph_de_CH


Trennmuster (hyph_de_DE.dic)
----------------------------

Die Trennmuster (hyph_de_DE.dic) basieren auf den TeX Trennmustern
"dehyphn.tex", revision level 31.
Lizenz der Trennmuster: LPPL. Die Anpassung der Trennmuster an
den in OpenOffice.org benutzten "ALTLinux LibHnj Hyphenator" wurde
mit dem Script substrings.pl durchgef�hrt, das unter
https://www.openoffice.org/lingucomponent/hyphenator.html als Teil
der Datei altlinux_Hyph.zip heruntergeladen werden kann.
Die Original-Trennmuster k�nnen hier heruntergeladen werden:
https://www.ctan.org/tex-archive/language/hyphenation/dehyphn.tex

11 changes: 11 additions & 0 deletions src/share/files/dictionaries/README_hyph_el_GR.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,11 @@
Hellenic hyphenation dictionary for OpenOffice.org 1.1.0
--------------------------------------------------------

Language: Greek a.k.a. Hellenic (el GR).
Version: 1.1b

License: LGPL
Author: InterZone <[email protected]>

This dictionary should be usable only for monotonic Greek (not polytonics, neither archaic). There may be some problems with words starting with accented vowels, feedback is welcome. Words in quotes do not hyphenate, but it seems like a problem with OpenOffice and not the hyphenation dictionary.

4 changes: 4 additions & 0 deletions src/share/files/dictionaries/README_hyph_en_GB.txt
Original file line number Diff line number Diff line change
@@ -1,5 +1,9 @@
hyph_en_GB.dic - British English hyphenation patterns for OpenOffice.org

version 2011-10-07

- remove unnecessary parts for Hyphen 2.8.2

version 2010-03-16

Changes
Expand Down
4 changes: 4 additions & 0 deletions src/share/files/dictionaries/README_hyph_en_US.txt
Original file line number Diff line number Diff line change
@@ -1,5 +1,9 @@
hyph_en_US.dic - American English hyphenation patterns for OpenOffice.org

version 2011-10-07

- remove unnecessary parts for the new Hyphen 2.8.2

version 2010-03-16

Changes
Expand Down
137 changes: 124 additions & 13 deletions src/share/files/dictionaries/README_hyph_es.txt
Original file line number Diff line number Diff line change
@@ -1,7 +1,7 @@
****************************************************************************
** **
** Patrones de separación silábica en español de **
** LibreOffice/Apache OpenOffice **
** Apache OpenOffice/LibreOffice **
** **
****************************************************************************
** VERSIÓN GENÉRICA PARA TODAS LAS LOCALIZACIONES DEL ESPAÑOL **
Expand All @@ -13,8 +13,8 @@ SUMARIO

1. AUTOR
2. LICENCIA
3. COLABORACIÓN
4. AGRADECIMIENTOS
3. INSTALACIÓN
4. COLABORACIÓN


1. AUTOR
Expand All @@ -23,21 +23,132 @@ SUMARIO
inicialmente por Santiago Bosio; mediante el uso de la herramienta libre
"patgen" y datos de entrenamiento etiquetados manualmente.

Si desea contactar al autor, por favor envíe sus mensajes mediante correo
electrónico a:

sbosio <en> openoffice <punto> org
(reemplace <en> por @ y <punto> por . al enviar su mensaje)

El listado es un desarrollo completamente nuevo, y NO ESTÁ BASADO en el
listado de patrones previo, elaborado por Marcelo Garrone.


2. LICENCIA

Este listado de patrones para separación silábica, integrado por el fichero
hyph_es_ANY.dic se distribuye
bajo un triple esquema de licencias disjuntas: GNU GPL versión 3 o posterior,
GNU LGPL versión 3 o posterior, ó MPL versión 1.1 o posterior. Puede
seleccionar libremente bajo cuál de estas licencias utilizará este diccionario.
En el fichero LICENSE.md encontrá más detalles.
hyph_es_ANY.dic se distribuye bajo un triple esquema de licencias disjuntas:
GNU GPL versión 3 o posterior, GNU LGPL versión 3 o posterior, ó MPL versión
1.1 o posterior. Puede seleccionar libremente bajo cuál de estas licencias
utilizará este listado.

Encontrará copias de las licencias adjuntas en este mismo paquete.

3. INSTALACIÓN

En Apache OpenOffice/LibreOffice, utilice el administrador de
extensiones, seleccionando para instalar directamente el fichero con
extensión ".oxt".

Para instalar en OpenOffice.org versión 1.x ó 2.x, deberá realizar una
instalación manual siguiendo estas instrucciones:

a) Copie el fichero hyph_es_ANY.dic en la carpeta de instalación de
diccionarios.

Si tiene permisos de administrador, puede instalar el diccionario de
manera que esté disponible para todos los usuarios, copiando el fichero al
directorio de diccionarios de la suite. Este directorio depende de la
plataforma de instalación. Podrá ubicarlo si ingresa en el ítem Opciones
del menú Herramientas. Despliegue la primera lista, etiquetada "OpenOffice.org"
y seleccione el ítem Rutas. La carpeta donde debe copiar los ficheros se
denomina "ooo", y la encontrará bajo el directorio que figura en la lista de
rutas con el tipo "Lingüística".

En caso de no contar con permisos de administrador, igualmente puede
realizar una instalación para su usuario particular, copiando el fichero al
directorio que figura en la lista de rutas con el tipo "Diccionarios definidos
por el usuario".

Estos directorios de configuración usualmente están ocultos. Deberá ajustar
las opciones del administrador de ficheros que utiliza para que se muestren
este tipo de ficheros o directorios. Consulte la ayuda para su plataforma en
caso que no sepa cómo hacerlo.

b) Edite la lista de diccionarios disponibles para añadir el nuevo diccionario.

En el directorio donde copió los diccionarios encontrará un fichero de
texto denominado "dictionary.lst". Modifíquelo como se indica a continuación,
utilizando el editor de textos de su preferencia.

El formato de la lista permite definir tres tipos de diccionarios
diferentes: de corrección ortográfica (DICT), de sinónimos (THES) o de
separación silábica (HYPH).

En este caso creará un nuevo ítem de tipo HYPH. Para cada entrada de este
tipo, debe definir el lenguaje y la región (utilizando códigos ISO estándares),
y especificar el nombre base de los ficheros que definen el diccionario. Para
el español, el código ISO de lenguaje se escribe "es" (en minúsculas, sin las
comillas). El código de región depende de cómo tenga configurado su sistema
(por lo general será el del país donde reside), elegible entre uno de los
siguientes:

3. COLABORACIÓN
Argentina: "AR" Honduras: "HN"
Bolivia: "BO" México: "MX"
Chile: "CL" Nicaragua: "NI"
Colombia: "CO" Panamá: "PA"
Costa Rica: "CR" Perú: "PE"
Cuba: "CU" Puerto Rico: "PR"
Rep. Dominicana: "DO" Paraguay: "PY"
Ecuador: "EC" El Salvador: "SV"
España: "ES" Uruguay: "UY"
Guatemala: "GT" Venezuela: "VE"

Este diccionario es resultado del trabajo colaborativo de muchas personas.
(El código de región se escribe en mayúsculas sin las comillas).

El nombre base del fichero es igual al del fichero de patrones, sin la
extensión (.dic).

Por ejemplo, si usted tiene las opciones de lingüística configuradas para
el idioma "Español (Argentina)", copie el fichero hyph_es_ANY.dic en el
directorio correspondiente, y cree una línea en el fichero 'dictionary.lst'
como la siguiente:

HYPH es AR hyph_es_ANY

c) Reinicie OpenOffice.org.

Guarde y cierre todos los documentos que tenga abiertos. Si utiliza la
plataforma de Microsoft Windows y tiene el inicio rápido de OpenOffice.org
activado, ciérrelo también.

Inicie nuevamente alguna de las aplicaciones de OpenOffice.org (cualquiera
de ellas servirá).

d) Configure las opciones de lingüística del programa.

Ingrese nuevamente al ítem Opciones del menú Herramientas y despliegue el
árbol "Configuración de idioma".

Entre las opciones del ítem "Idiomas" hay una lista donde se configura el
idioma occidental utilizado como idioma predeterminado para los documentos
nuevos.

Elija de esa lista el idioma y región que configuró en el fichero
'dictionary.lst'. Para el ejemplo utilizado sería "Español (Argentina)".

Si necesitara ayuda para realizar cualquiera de estos pasos, envíe un
mensaje al encargado de mantenimiento del diccionario, o a las listas de
correo del proyecto Apache OpenOffice en español
(http://www.openoffice.org/es/soporte/listas.html).


4. COLABORACIÓN

Este desarrollo es resultado del trabajo colaborativo de muchas personas.
La buena noticia es que ¡usted también puede participar!

¿Tiene dudas o sugerencias? ¿Desearía ver palabras agregadas, o que se
realizaran correcciones? Consulte las indicaciones técnicas publicadas en
CONTRIBUTING.md. Estaremos encantados de atenderle.

realizaran correcciones? Sólo debe contactar al encargado de mantenimiento de
este diccionario, a través de su correo electrónico, quien se encargará de
evacuar sus dudas, o de realizar las modificaciones necesarias para la próxima
versión.
Loading

0 comments on commit 1abd1c2

Please sign in to comment.