LanguageTool

Logiciel capture d'écran:
LanguageTool
Détails logiciels:
Version: 2.9 Mise à jour
Date de transfert: 14 Apr 15
Développeur: Daniel Naber
Licence: Gratuit
Popularité: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool est un programme open source de relecture conçu pour trouver les erreurs que les outils réguliers correcteur orthographique ne peuvent pas détecter. Il est un style et un vérificateur de grammaire qui permettra de trouver des erreurs pour lesquelles une règle est définie dans ses fichiers de configuration XML, tels que le mélange jusqu'à & ldquo fondé sur des règles; leur & rdquo; avec & ldquo;. & rdquo il;


Détecte les différents problèmes de grammaire

Le programme peut également détecter divers problèmes de grammaire et est livré avec le soutien de plus de 20 langues, dont l'anglais, allemand, polonais, français, espagnol, suédois, grec, chinois, danois, japonais, islandais, portugais et portugais brésilien.
En outre, il dispose d'une interface utilisateur graphique facile à utiliser, simple et directe qui permet à quiconque de coller le texte qui doit être vérifié orthographique. Il peut vérifier le texte dans le presse-papiers, étiquette de texte, couper / copier / coller du texte, et de résider dans la région de plateau de système.


Détecte une large gamme de problèmes

De la boîte de dialogue Options, vous pouvez activer le type de problèmes l'application peut détecter, y compris les mauvais style, les erreurs de grammaire, l'argot, des erreurs de ponctuation, les fautes de frappe possibles, des phrases redondantes, souvent confuses paroles, collocations, la capitalisation, la sémantique, ainsi que des phrases non-standard.


LanguageTool pour LibreOffice et OpenOffice

En plus d'être une application autonome, LanguageTool est également disponible comme une extension pour deux des suites bureautiques les plus populaires et les plus puissants open-source, LibreOffice et OpenOffice.org Apache, permettant aux utilisateurs de relire leurs textes en cliquant-droit sur les phrases sélectionnées ou paragraphes.


LanguageTool pour Mozilla Firefox

En outre, l'application est également disponible pour téléchargement comme un add-on pour le monde & rsquo; s navigateur open-source la plus populaire dans le monde, Mozilla Firefox. Il ne nécessite aucun redémarrage et place un petit bouton sur la barre d'outils principale, vous permettant de relire le texte en surbrillance des sites Internet ou des formes.


Sous le capot et la disponibilité

L'application est entièrement écrit dans le langage de programmation Java, ce qui signifie qu'il & rsquo; un logiciel multi-plateforme, conçu pour fonctionner avec une distribution GNU / Linux, ainsi que le BSD, Solaris, X exploitation Microsoft Windows et Mac OS systèmes, où l'environnement d'exécution Java est installé.

Ce qui est nouveau dans cette version:

  • catalan:
  • POS jour dictionnaire de tags
  • ajouté de nouvelles règles
  • fausses alarmes fixes
  • anglais:
  • Ajout de quelques règles fixes et quelques fausses alarmes
  • de nombreuses nouvelles règles de style ajoutée apportée par Heikki Lehvaslaiho. Comme ceux-ci peuvent causer des fausses alarmes, ils ne sont pas activés par défaut. Vous pouvez les activer en tournant sur toutes les règles dans la nouvelle catégorie «Plain English».
  • Esperanto:
  • ajouté quelques nouvelles règles
  • Français
  • POS jour tag dictionnaire et dictionnaire Hunspell à Dicollecte-5.3
  • allemand:
  • ajouté quelques nouvelles règles et les fausses alarmes fixes
  • Ajout d'une nouvelle règle qui vérifie accord sujet du verbe. Pour l'instant, seuls les cas avec 'ist »,« sind »,« guerre », et« Waren' sont pris en charge. Exemple pour les erreurs qui sont détectées: ". Der Hund sind SchA et para; n ',' Die Autos ist schnell. Pour faire ce travail de règle, les phrases sont désormais unifiés dans disambiguation.xml: par exemple, «Mann» dans l'expression «ein Mann» ne conservera sa lecture nominative (SUB: NOM: NAS: MAS), alors qu'elle l'habitude d'avoir aussi lectures accusatif et datif (SUB: AKK: NAS: MAS, SUB: DAT: NAS: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • italien:
  • amélioré quelques règles
  • polonais:
  • ajouté plusieurs nouvelles règles
  • portugais:
  • ajoutées / améliorées plusieurs règles
  • 3695 mots composés (avant la réforme) - la plus grande base de données gratuite
  • Russie:
  • ajoutée et l'amélioration des règles
  • ukrainien:
  • dictionnaire grosse mise à jour
  • les nouvelles règles de grammaire
  • nouvelle règle pour remplacer simples suggestions douces
  • amélioration de désambiguïsateur
  • amélioration de marquage composé et d'orthographe

  • Améliorations
  • initiales marquage

  • Améliorations de tokenizing
  • phrases et de mots
  • une gestion améliorée des symbole des stres et trait d'union
  • règles bitextes:
  • ajouté une règle simple pour vérifier si les traductions finissent avec le même signe de ponctuation que l'original (ce qui inclut seulement.?! Caractères).
  • il est maintenant possible d'ajouter des fichiers de règles de bitexte externes sur la ligne de commande, en utilisant
  • l'option -bitextrule. Le chemin du fichier doit être absolue. Note:. Ce qui permet en utilisant également des règles bitextes pour les langues qui ont pas de règles de bitextes inclus par défaut
  • Orthographe:
  • Les nouveaux fichiers à /hunspell/spelling.txt peut être utilisé pour ajouter des mots acceptées pour le correcteur orthographique qui sont aussi considérée lors de la création des suggestions pour les mots mal orthographiés. Ceci est similaire aux fichiers /hunspell/ignore.txt, qui liste les mots qui sont * pas * utilisés lors de la création des suggestions pour les mots mal orthographiés accepté.
  • API:
  • JLanguageTool.activateDefaultPatternRules () et JLanguageTool.activateDefaultFalseFriendRules () ont été enlevés - toutes les règles de configuration et les règles de faux ami (si une deuxième langue est spécifiée) sont maintenant activés automatiquement lorsque le constructeur de JLanguageTool est appelé. Si vous avez besoin d'un correcteur sans les règles de configuration XML, prolonger votre classe de langue (par exemple, «anglais») avec celui qui écrase les getPatternRules (méthode) et retourne une liste vide il.
  • ManualTagger.lookup () a été remplacé par ManualTagger.tag () après avoir été dépréciée depuis la dernière version
  • Toutes les méthodes et les champs de la classe "de la langue 'statiques ont été déplacés vers la nouvelle classe des« langages ». Pour l'instant, les méthodes / champs en classe de langue existent encore mais ont été dépréciées.
  • LanguageIdentifierTools a été supprimé. Utiliser LanguageIdentifier place.
  • Retiré (par défaut) ResourceDataBroker.setResourceDir () et setRulesDir () car ceux-ci peuvent être définies avec le constructeur
  • Nettoyé jusqu'à Contributeur de classe, par exemple enlever getRemark ()
  • Category.setDefaultOff () a été supprimé, ce qui peut être réglé via un constructeur maintenant
  • Cours renommés: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Autres petits nettoyages API qui ne devrait pas affecter les cas d'utilisation communs, par exemple, IncorrectExample.getCorrections () retourne et liste non modifiable maintenant, la suppression des méthodes obsolètes.
  • Embedded Server:
  • échappement XML a été fixée, ce qui pourrait provoquer des documents XML invalides à retourner
  • nouvelle option du fichier de config 'maxWorkQueueSize' qui vous permet de définir la taille maximale de la file d'attente de demande - si elle devient plus grande que cela, les demandes seront rejetées (503 Service indisponible)
  • Le serveur répond maintenant avec les codes d'état HTTP plus spécifiques à ces conditions d'erreur: 413 Entité de demande trop grande - si le texte dépasse la taille maximale de texte 503 Service Unavailable - si le chèque dépasse le temps de vérifier maximale
  • GUI:
  • L'interface graphique autonome peut maintenant prendre un fichier de texte brut comme argument, ce fichier sera alors chargé au démarrage (Github question n ° 232).
  • de ligne de commande:
  • Il est maintenant possible d'ajouter un fichier de règle extérieure lors de l'appel LanguageTool partir de la ligne de commande. Utilisez --rulefile pour ajouter un fichier. Si le nom de fichier a un format qui contient un nom de langue, il sera utilisé à d'autres règles; sinon, il remplacera les règles. Vous pouvez également charger un fichier externe avec de faux amis en utilisant les --falsefriends d'options. Le nom du fichier doit être un chemin de fichier absolu, et les fichiers de faux amis sont toujours ajoutés à ceux qui sont chargés de la langue. (Github question # 192)
  • syntaxe de la règle:
  • Une règle peut maintenant avoir un exemple unique phrase tant qu'il a un attribut 'correction' - cela peut sauver une certaine redondance si la seule phrase correcte est la même que la phrase incorrecte avec la correction appliquée. Avant, une règle nécessaire au moins deux phrases d'exemple.
  • 'exemple' élément: type = "incorrect" est désormais facultatif si il ya un attribut «correction». L'attribut «de correction» implique que la phrase est incorrecte.
  • 'exemple' élément: type = "correcte" est désormais facultatif. Aucun attribut 'type' et aucun attribut 'correction' implique que la phrase est correcte.
  • interne:
  • Nous avons passé d'Apache Tika à language-détecteur (https://github.com/optimaize/language-detector) pour identifier automatiquement la langue du texte. Il devrait être plus rapide et les résultats devraient être plus fiables. Détection des Asturies et de Galice a dû être désactivé parce que la qualité de détection était trop faible et également affecté la détection de l'espagnol.
  • Correction d'une régression qui rendait impossible de charger des fichiers de règles externes dans l'interface graphique.

Ce qui est nouveau dans la version 2.8:

  • asturien:
  • la dépendance retiré sur Hunspell, utilise maintenant Morfologik pour la vérification orthographique
  • Breton:
  • ajouté et amélioré quelques règles
  • catalan:
  • dictionnaire mise à jour
  • ajoutée et l'amélioration des règles
  • fausses alarmes fixes
  • néerlandais:
  • ajouté et amélioré de nombreuses règles
  • anglais:
  • des nouvelles règles (grâce à Nick Hough)
  • mise à jour des dictionnaires de tagger et synthétiseur, fixant le numéro # 202
  • nouveau filtre à utiliser pour faire correspondre la partofspeech des parties de mots, par exemple:. Dans * Cela ne fera que maintenir les matchs pour les mots qui commencent par «in» et où la partie après le 'dans' est un (POS tag adjectif «JJ»). Le «non: 1 'est la position symbolique, à savoir ici le premier (et seul) correspondant est appelé
  • .
  • français:
  • ajouté et amélioré quelques règles
  • allemand:
  • ajouté et amélioré quelques règles
  • polonais:
  • ajouté et amélioré plusieurs règles
  • ajouté et amélioré avec de faux amis Anglais
  • portugais:
  • ajoutées / améliorées plusieurs règles
  • espagnol:
  • la dépendance retiré sur Hunspell, utilise maintenant Morfologik pour la vérification orthographique
  • Reformaté fichier de règles
  • Ajout de plus de règles
  • tagalog:
  • la dépendance retiré sur Hunspell, utilise maintenant Morfologik pour la vérification orthographique
  • le caractère tiret ("") est un séparateur maintenant quand tokenizing le texte
  • Russie:
  • ajoutée et l'amélioration des règles
  • ajouté quelques règles faux ami (Russe / anglais)
  • ukrainien:
  • de nombreuses nouvelles règles (y compris l'accord avec les noms, les expressions de temps, etc)
  • amélioration de la couverture de la règle
  • Mise à jour du dictionnaire (grandes améliorations pour les noms propres et les cas de vocatif)
  • nouvelle étiquette et de la règle d'avertir sur l'orthographe de remplacement
  • ajouté des informations de fréquence de mots pour améliorer les suggestions d'orthographe
  • des nouvelles règles de désambiguïsateur
  • Règle Syntaxe:
  • ... peut maintenant être ajoutée à une RuleGroup d'affecter toutes les règles de ce groupe
  • Si vous développez vos propres règles qui ne font pas partie de la LT, vous pouvez maintenant ajouter externe = "yes" à vos catégories pour empêcher le lien de règle à community.languagetool.org d'apparaître dans notre GUI autonome (le lien ne fonctionnerait pas des règles qui ne sont pas partie de la distribution principale de LT). (Github question # 223)
  • Si un groupe de règle spécifie default = "off", les règles à l'intérieur du groupe de règles ne peuvent pas spécifier également défaut = "on" / "off".
  • API:
  • Suppression de classes et méthodes qui avaient été dépréciées depuis 2.7 ou plus
  • Embedded Server:
  • Les options du fichier de config 'requestLimit »et« requestLimitPeriodInSeconds' peut maintenant aussi être utilisé pour le serveur HTTP (et pas seulement pour le serveur HTTPS)
  • Nouvelle option de fichier de config 'trustXForwardForHeader': définir ce à 'true' si vous exécutez le serveur derrière un proxy inverse et que vous voulez la limite de demande de travailler sur les adresses IP originaux fournis par l'en-tête HTTP "Xforwardedfor ', généralement fixé par le proxy. Si vous exécutez derrière un proxy, mais ne définissez pas cette propriété à true, un utilisateur peut utiliser toutes les demandes afin que les autres utilisateurs pourront également obtenir un message d'erreur en raison de la limite de demande.
  • réponse de Fix Après la mode Date limite: ... était parfois vide, confondant la vérification de texte dans WordPress
  • bitextes règles ne sont pas désactivés correctement, même si elles ont été spécifiés avec un bon paramètre pour le serveur; maintenant il est fixé
  • Correction d'un problème avec des positions irrégulières de certaines règles de bitextes (question n ° 218)
  • GUI:
  • Un nouveau paramètre 'errorColors »a été ajoutée au fichier de configuration de languagetool.cfg. Il peut être utilisé pour définir la couleur d'erreurs de fond. Par exemple, errorColors = typographique: # b8b8ff, style: # ffb8b8 montrera erreurs typographiques '' avec un fond bleu et erreurs »de style» avec un fond rouge dans la partie supérieure de la fenêtre LT. «Typographique» et «style» sont les types qui sont définies dans grammar.xml comme "type = ...". Il ya pas d'interface utilisateur encore pour configurer ces couleurs. Notez que vous ne devez modifier le fichier de languagetool.cfg quand LT ne fonctionne pas.
  • interne:
  • Correction: les règles à l'intérieur d'un groupe de règles avaient pas été activé par défaut si une règle précédente de la même RuleGroup utilisé = "off"
  • Les mots ne sont plus ignorés par le correcteur orthographique, simplement parce qu'ils se produisent dans la suggestion d'une règle. Si vous voulez que le correcteur orthographique d'ignorer mots à l'échelle mondiale, les ajouter à hunspell / ignore.txt. Pour les ignorer, selon le contexte, ajouter une règle 'de ignore_spelling' à disambiguation.xml.
  • Un fichier 'hunspell / prohibit.txt' peut maintenant être utilisé pour marquer des mots que les erreurs d'orthographe, même si le correcteur orthographique devrait normalement accepter. Ceci est utile pour améliorer la LanguageTool correcteur orthographique sans attendre le vérificateur en amont pour être mis à jour. Le fichier 'prohibit.txt' est le contraire de 'ignore.txt', ce qui provoque le correcteur orthographique d'ignorer mots.
  • Le tagueur partofspeech pour la plupart des langues peut maintenant être étendue en ajoutant des entrées dans le fichier org / LanguageTool / resource / XX / added.txt (XX étant le code de langue). Le format est "FullForm forme de base postag", trois colonnes séparées par des onglets. Cela rend plus facile pour les utilisateurs (et les développeurs) d'étendre le tagger POS, car ils ne doivent pas exporter, modifier et recréer le dictionnaire binaire pour chaque changement.

Ce qui est nouveau dans la version 2.7:

  • Breton:
  • ajoutée et l'amélioration des règles
  • Nouvelle règle qui vérifie si un jour de semaine correspond à une date, par exemple, détecte "Gwener 28 un EOST viz 2014», que cette date ne sont pas un vendredi.
  • catalan:
  • ajoutée et l'amélioration des règles
  • fausses alarmes fixes
  • néerlandais:
  • ajouté et amélioré de nombreuses règles
  • commuté à correcteur orthographique basé Morfologik
  • -English:
  • Voulez-vous faire partie de l'équipe qui développe outil de relecture Open Source le plus puissant du monde? Nous recherchons un responsable pour les règles anglaises en LanguageTool. Voir http://wiki.languagetool.org/tasks-for-language-maintainers pour plus de détails.
  • Tous les dictionnaires anglais ont été étendues à contenir des classes de fréquence de mots pour améliorer les suggestions du correcteur orthographique (les données de fréquence est prise de https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / imes / latin / dictionnaires, comme pour les autres langues qui utilisent déjà cette fonctionnalité).
  • suggestions mieux pour les apprenants en anglais: verbes irréguliers, noms, adjectifs et maintenant ont généralement une meilleure suggestion. Par exemple, «Pensé» suggère «pensée», «womans» suggère «femmes».
  • Plus de fautes d'orthographe fournissent des suggestions maintenant, par exemple, 'Garentee' (garantie), «reconnaissant» (reconnaissant). Cela peut entraîner une diminution des performances d'environ 10% (plus pour les textes avec beaucoup de mots inconnus).
  • Nouvelle règle qui vérifie si un jour de semaine correspond à une date, par exemple, détecte "Lundi 7 Octobre 2014», que cette date ne sont pas un lundi. Cette règle ne fonctionne que si elle détecte le format de date utilisé. Jusqu'à présent, ces formats sont supportés: * "Lundi 7 Octobre 2014» * "le lundi 7 octobre 2014" * "Lundi 7 Octobre, 2014» * "le lundi 7 octobre 2014" * (cela fonctionne aussi avec la semaine abrégé jours comme Mo ou lundi pour le lundi)
  • Esperanto:
  • Nouvelle règle qui vérifie si un jour de semaine correspond à une date, par exemple, détecte "Vendredon la 28-un de AAgusto 2014», que cette date ne sont pas un vendredi.
  • français:
  • POS jour tag dictionnaire et dictionnaire Hunspell à Dicollecte-5.2
  • ajouté un synthétiseur - la règle de l'accord peut maintenant faire des suggestions pour des erreurs
  • ajoutées / améliorées plusieurs règles
  • Nouvelle règle qui vérifie si un jour de semaine correspond à une date, par exemple, détecte "vendredi 28/08/2014", que cette date ne sont pas un vendredi.
  • allemand:
  • Correction d'un rare et une NullPointerException ArrayIndexOutOfBoundsException
  • plusieurs fausses alarmes fixes
  • ajoutée et l'amélioration des règles
  • Nouvelle règle qui vérifie les phrases sans verbe (désactivé par défaut en raison du risque de fausses alarmes)
  • Nouvelle règle qui vérifie si un jour de semaine correspond à une date, par exemple, détecte "Dienstag, 29/09/2014", que cette date ne sont pas un mardi.
  • Amélioration des performances pour vérification orthographique suggestions
  • persan:
  • a ajouté le support initial pour persan (farsi)
  • polonais:
  • ajouté et amélioré certaines règles
  • nouvelle règle qui vérifie si un jour de semaine correspond à une date
  • portugais:
  • ajoutées / améliorées plusieurs règles
  • ajouté plusieurs dizaines de mots composés
  • Russie:
  • ajouté de nouvelles règles
  • fixer SourceForge demande de la fonction # 38 (vérifier les différents guillemets)
  • ajouté quelques règles faux ami (Russe / anglais)
  • nouvelle règle qui vérifie si un jour de semaine correspond à une date, par exemple, détecte "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro; & ETH; & frac12; N & sbquo; N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. ", que cette date ne sont pas un lundi .
  • élargi règle composé de Russie avec de nouveaux mots de postag dictionnaire
  • espagnol:
  • Ajout d'une nouvelle catégorie de POS Z (pour les numéros d'épeautre, par exemple «uno», «dos», ...)
  • numéros Spelled peuvent désormais être détectés et gérés à la fois dans homonymie et les règles.
  • Correction de quelques lemmes incorrectes dans POS dictionnaire.
  • Ajout hybride chunker-désambiguïsateur.
  • Tamil:
  • Ajout du support initial pour Tamil. Si la police de Tamil est pas correctement affiché sur votre ordinateur et que vous utilisez Windows, vous pourriez avoir besoin pour appliquer le travail autour décrit ici: https://bugs.openjdk.java.net/browse/JDK-8008572
  • ukrainien:
  • grosse mise à jour pour les POS dictionnaire (correctifs et de nouveaux mots)
  • un peu de l'étiquette de POS renommé pour la cohérence; de nouvelles étiquettes pour les abréviations et des mots rares
  • de nombreuses nouvelles règles et des correctifs pour les règles existantes
  • nouvelle règle qui vérifie si un jour de semaine correspond à une date, par exemple, détecte "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH; 'N- & ETH;» & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 », que cette date ne sont pas un lundi
  • amélioration de la performance de normalisation jeton
  • l'intégration de LibreOffice:
  • Ne vous trompez pas en bas de page dans LibreOffice 4.3 et plus tard (il nous fournit maintenant avec les positions de bas de page que les méta-données, on peut donc les ignorer).
  • API:
  • des améliorations de performance majeur pour les cas d'utilisation multi-thread, où JLanguageTool est créé par thread, mais l'objet de la langue (par exemple «allemand») est créée une seule fois. Overhead pour créer JLanguageTool devrait maintenant être beaucoup plus faible.
  • Retiré plusieurs classes et méthodes qui avaient été dépréciées depuis la version 2.6
  • DutchSpellerRule enlevé - utiliser MorfologikDutchSpellerRule place
  • La signature de Language.getRelevantRules () a changé
  • Les constructeurs JLanguageTool et MultiThreadedJLanguageTool ne déclarent pas de lancer une IOException plus
  • WhitespaceRule a été renommé MultipleWhitespaceRule (WhitespaceRule existe toujours mais a été désapprouvée)
  • Déconseillé certaines méthodes dont la visibilité sera réduite (par exemple, du secteur public vers protégée)
  • MorfologikSpellerRule.getRuleMatch (String, int) a été renommé MorfologikSpellerRule.getRuleMatches (String, int)
  • Le constructeur de RuleMatch lance maintenant une exception si toPosition ne dépasse pas fromPosition
  • Introduit une nouvelle TextLevelRule classe abstraite qui étend la règle et qui peut être utilisé pour les règles qui couvrent plus de phrases simples.
  • Ligne de commande:
  • Activation et désactivation des règles spécifiques dans le même temps est maintenant autorisé. Afin de tester seulement certaines règles (en désactivant tout le reste), qui, auparavant, a été fait avec "--enable LIST_OF_RULES", maintenant utiliser "LIST_OF_RULES --enabledonly --enable" (ou "-eo -e LIST_OF_RULES").
  • Embedded Server:
  • Deux nouvelles options peut être définie dans le fichier de propriétés pour faire LanguageTool retourner le même format XML comme après la date limite (ATD). De cette façon, il peut être utilisé comme une solution de remplacement pour ATD: * Mode - 'LanguageTool »ou« AfterTheDeadline' * afterTheDeadlineLanguage - code de la langue si le mode est réglé sur «AfterTheDeadline 'NOTE par défaut: le mode' AfterTheDeadline 'doit être considéré expérimentale pour le moment.
  • La nouvelle option 'maxCheckThreads »permet de régler le nombre maximal de threads de travail sur les demandes en parallèle. La valeur par défaut est 10, comme il l'habitude d'être.
  • Internes:
  • New AbstractDateCheckFilter de règle abstraite qui permet de vérifier si un match la semaine de jour et la date. Par exemple "Mardi 29 Septembre, 2014» a pu être détectée, que le 29 Septembre 2014, ne sera pas réellement un mardi. Il utilise la nouvelle interface RuleFilter expérimentale qui peut être appelé à partir de XML avec le nouvel élément 'filter'. «Filtre» prend ces attributs: «classe»: le nom complet d'une classe Java qui implémente RuleFilter, par exemple, "org.languagetool.rules.de.DateCheckFilter" "args": une chaîne comme "l'année: 1 mois: 2 jours: 3 jour de semaine: 4", à savoir une liste séparée par des espaces de paires clé / valeur, où x se résoudre à valeur symbolique du motif (comme dans l'élément «message»)
  • La règle composé ignore désormais jetons qui ont été vaccinés dans le disambiguation.xml
  • Le "filtre" action dans le désambiguïsateur est maintenant appliquée uniquement aux étiquettes de point de vente qui correspondent à la balise POS donné. Si elles ne correspondent pas, la règle est pas appliquée.
  • Si vous étendant les règles XML comme décrit au http://wiki.languagetool.org/tips-and-tricks#toc2, les fichiers de règles et externes homonymie peut maintenant être hébergé sur un serveur protégé par mot de passe en spécifiant une URL comme ceci: http: // user: password@example.org/path/user-rules.xml
  • Le tiret long ("A & euro;" ") est maintenant un caractère de tokenizing pour toutes les langues
  • Nouvelle fonctionnalité:
  • L'utilisation de modèles de langue
  • LanguageTool peut maintenant faire usage de données de Ngram. ngram données est l'information sur la façon dont se produisent souvent des phrases dans une langue. Actuellement, celui-ci utilise des phrases de longueur 3.
  • Les données sont utilisées par une domination anglaise pour trouver des erreurs homophones, comme mélanger grossier / cours ou flair / flare. LanguageTool avait quelques règles de ce genre avant, mais la nouvelle règle prend désormais en charge environ 900 de ces paires de mots / ensembles.
  • Les données nécessaires pour cette est énorme (7 Go pour l'anglais) et donc ne fait pas partie ou LanguageTool.
  • Les données (en anglais seulement pour le moment) et plus de documentation est disponible à http://wiki.languagetool.org/finding-errors-using-big-data
  • Utilisation ngrams fait LanguageTool légèrement plus lent lorsque les données sont stockées sur un disque dur SSD.
  • Si non stockée sur un SSD, la performance pourrait diminuer considérablement.
  • Utilisez la nouvelle option --languagemodel avec le client de ligne de commande pour activer la règle qui utilise les données. Cette option est pas encore disponibles pour l'interface graphique autonome.

Ce qui est nouveau dans la version 2.4.1:

  • bibliothèques Morfologik Mise à jour à 1.8.3 pour fixer suggestions lents dans le correcteur orthographique, qui a touché au moins en-US

Ce qui est nouveau dans la version 2.4:

  • Breton:
  • SRX phrase tokenization
  • ajouté / amélioré quelques règles
  • fixes quelques fausses alarmes
  • fixe suggestions incorrectes grâce à des tests supplémentaires sur les corrections
  • catalan:
  • ajoutées / améliorées plusieurs règles
  • fausses alarmes fixes
  • ajouts et corrections apportées au dictionnaire de tagger
  • supprimé certains mots de synthèse dictionnaire (voir filterarchaic.txt)
  • ajouté données de fréquence au dictionnaire de tagger; fréquence liste de mots vient du projet Gaia, avec Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • anglais:
  • ajouté / amélioré quelques règles
  • fixes quelques fausses alarmes
  • français:
  • ajoutées / améliorées plusieurs règles
  • fixes quelques fausses alarmes
  • allemand:
  • ajoutées / améliorées plusieurs règles
  • ajouté un synthétiseur de la règle de l'accord peuvent maintenant faire des suggestions pour des erreurs (pas toutes les suggestions sont corrects, cependant)
  • polonais:
  • ajouté / améliorées plusieurs règles, en particulier pour trait d'union et l'utilisation du tableau de bord
  • ajouté des informations de fréquence pour la correction orthographique dictionnaire; fréquence liste de mots vient du projet Gaia, avec Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • fixes quelques fausses alarmes
  • portugais:
  • ajouté / améliorées plusieurs règles (il inclut maintenant des règles de genre "a" / "o")
  • il a maintenant 3400+ mots composés
  • le fichier JAR a été renommé languagetool.jar, de languagetoolstandalone.jar autrefois pour éviter toute confusion à propos de ce 'standalone' signifie dans ce contexte (github question n ° 29)
  • pour les langues avec de nombreuses règles (comme le français ou l'allemand) la performance sur les longs textes a été augmenté d'environ 2,030%
  • correctif pour threadsafety (pourrait que les accrocher dans MultiWordChunker)
  • Correction d'un bug où les annotations de chunk ont ​​pas été testées dans les groupes
  • fix: 1 et n'a pas été évaluée dans ...
  • Correction d'un bogue dans le mécanisme d'unification que jeté certaines des interprétations correspondants prématurément
  • Ajout du support pour les annotations de chunk dans le désambiguïsateur, et fixé un bogue dans les jetons de filtrage avec annotations chunk
  • bibliothèques mises à jour Morfologik à 1.8.2 (de corrections de bugs, plus stricte vérification de sanité d'entrée, ajouter des données de fréquence à des dictionnaires)
  • a ajouté la possibilité d'inclure des données de fréquence à taggging ou d'orthographe dictionnaires. Le format attendu des listes de mots de fréquence est celui dans le projet Gaia, avec Apache License, version 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • de nouveaux outils de ligne de commande pour exporter et créer des dictionnaires binaires:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • l'intégration LibreOffice / OpenOffice:
  • a ajouté une solution de contournement pour la détection incorrecte de peine pour le cas où une note est apparue après un arrêt complet de la phrase (Sourceforge bug # 191)
  • GUI autonome:
  • La boîte de dialogue ouverte par le "Plus ..." dans le menu contextuel d'une erreur va maintenant afficher également des exemples de phrases correctes et incorrectes
  • API:
  • SentenceTokenizer est maintenant une interface, la mise en œuvre a été déplacé vers RegexSentenceTokenizer, mais cela est obsolète et doit être utilisé SRXSentenceTokenizer place
  • Certaines méthodes de org.languagetool.tools.StringTools ont été déplacés à la classe org.languagetool.gui.Tools dans le projet de languagetoolguicommons
  • LanguageToolListener.languageToolEventOccured () a été renommé LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator est pas publique plus (ne devrait pas affecter n'importe qui)
  • enlevé DanishSentenceTokenizer qui avait été déconseillée pendant trois ans
  • Rule.getCorrectExamples () et Rule.getIncorrectExamples () ne retourne pas plus nulle mais une liste vide si il n'y a pas d'exemples. Par conséquent, setCorrectExamples () et () setIncorrectExamples ne plus accepter nulle.
  • Rule.getId () peut retourner une chaîne maintenant, pas seulement ASCIIonly cordes (en fait cela a été le cas auparavant, comme la restriction de ASCIIonly n'a jamais été appliquée et que mentionné dans la javadoc)
  • languagetoolwikipedia: les options en ligne de commande pour contrôler une décharge Wikipedia ont été simplifiées. La commande peut maintenant être appelé comme ceci: pot de java languagetoolwikipedia.jar checkdata l en f enwiki20130621pagesarticles.xml Appelez juste "pot de java languagetoolwikipedia.jar checkdata" pour obtenir un message d'utilisation. Plus d'un fichier peut être spécifié avec l'option f. En plus de Wikipédia décharges XML, fichiers CSV de Tatoeba (http://tatoeba.org) sont également pris en charge, ils doivent être filtrés premier à ne contenir que la langue concernée.

Ce qui est nouveau dans la version 2.3:

  • Breton:
  • ajouté / amélioré quelques règles
  • fausses alarmes fixes
  • mise à jour le dictionnaire de POS d'Apertium (svn r47282)
  • catalan:
  • a ajouté le support pour le code langue ca-ES-valencia (catalan de Valence), pour être utilisé dans LibreOffice 4.2.0
  • ajouté une règle remplacer simple avec des centaines de suggestions de remplacement
  • ajoutées / améliorées plusieurs règles
  • fausses alarmes fixes
  • chinois:
  • a ajouté une solution de contournement pour un StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • anglais:
  • ajouté les patrons de remplacement pour le vérificateur d'orthographe pour faire des suggestions mieux (offre maintenant «enseigné» pour «enseigné»)
  • ajouté / amélioré quelques règles
  • français:
  • ajouté / amélioré quelques règles
  • fausses alarmes fixes
  • POS jour tag dictionnaire et dictionnaire Hunspell à Dicollecte-4.12
  • allemand:
  • ajoutées / améliorées plusieurs règles
  • portugais:
  • ajouté / amélioré quelques règles
  • il a maintenant 3300+ mots composés
  • ukrainien:
  • ajoutées / améliorées plusieurs règles
  • le code source a été déplacé vers github: https://github.com/languagetool-org/languagetool
  • LanguageTool nécessite Java 7 maintenant
  • LanguageTool fait usage de plusieurs threads maintenant pour le texte de vérifier sur le matériel moderne, l'amélioration des performances (cela affecte la version stand-alone, la version en ligne de commande et l'extension LibreOffice / OpenOffice)
  • syntaxe de la règle:
  • support préliminaire pour les nouveaux attributs min / max qui permettent de faire correspondre un élément qui apparaît le nombre de fois donné. Par exemple: foo correspondra à rien ou "foo", à savoir "foo" est foo option correspondra à «foo» ou «foo foo" foo va correspondre à rien, "foo", ou "foo foo" utilisation max = "- 1" pour permettre occurrences illimitées. Pour min, seulement 0 ou 1 est pris en charge (1 par défaut).
  • appui ou déclarations. Par exemple: un interne et l'exécution, une règle contenant OU-déclarations est convertie en plusieurs règles ou sans-déclarations
  • .
  • anglais a maintenant un chunker pour détecter, entre autres, des morceaux de nom singulier et pluriel. Ceci est documenté au http://wiki.languagetool.org/using-chunks
  • version autonome:
  • La version autonome souligne maintenant erreurs avec un rouge (erreurs d'orthographe) ou bleu (autres erreurs) ligne (Panagiotis Minos)
  • Rappelez-vous la sélection de la langue pour le prochain départ
  • Amélioration de la fenêtre et le placement de dialogue dans une configuration multi-moniteur
  • serveur intégré: utilise le port par défaut (8081) de nouveau il est lancé sans arguments
  • mise à jour de la bibliothèque morfologik égrappage à la version 1.7.1 pour permettre de meilleures suggestions, y compris la manipulation correcte des signes diacritiques et les patrons de remplacement (équivalents du PAM et de caractéristiques REP dans les dictionnaires Hunspell)
  • OpenOffice intégration / LibreOffice:
  • fix: le "A propos" de dialogue ne fonctionne pas dans Apache OpenOffice 4.0
  • fix: règles spécifiques à chaque pays (comme pour l'anglais britannique) ne fonctionne pas
  • API:
  • Dans la classe de langue, getCountryVariants () a été renommé getCountries (), et une nouvelle méthode getVariant a été ajouté.
  • Certaines méthodes ont été dépréciées
  • Certaines méthodes ont été déplacés de la classe Outils (LanguageTool-core) à la nouvelle classe de CommandLineTools (LanguageTool-ligne de commande)










Ce qui est nouveau dans la version 2.2:



Ce qui est nouveau dans la version 2.1:





Ce qui est nouveau dans la version 2.0:







Exigences :

  • Java 2 Standard Edition Runtime Environment

D'autres logiciels de développeur Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Commentaires à LanguageTool

Commentaires non trouvées
Ajouter un commentaire
Tourner sur les images!