NameTag 3: A Tool and a Service for Multilingual/Multitagset NER
( NameTag 3: Nástroj a služba pro vícejazyčné a vícetagsetové rozpoznávání pojmenovaných entit )

Datum vydání
2025Publikováno v
Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 3: System Demonstrations)Nakladatel / Místo vydání
Association for Computational Linguistics (Kerrville, TX, USA)ISBN / ISSN
ISBN: 979-8-89176-253-4Informace o financování
UK//COOP
MSM//LM2023062
MSM//EH22_008/0004605
Metadata
Zobrazit celý záznamKolekce
Tato publikace má vydavatelskou verzi s DOI 10.18653/v1/2025.acl-demo.4
Abstrakt
We introduce NameTag 3, an open-source tool and cloud-based web service for multilingual, multidataset, and multitagset named entity recognition (NER), supporting both flat and nested entities. NameTag 3 achieves state-of-the-art results on 21 test datasets in 15 languages and remains competitive on the rest, even against larger models. It is available as a command-line tool and as a cloud-based service, enabling use without local installation. NameTag 3 web service currently provides flat NER for 17 languages, trained on 21 corpora and three NE tagsets, all powered by a single 355M-parameter fine-tuned model; and nested NER for Czech, powered by a 126M fine-tuned model. The source code is licensed under open-source MPL 2.0, while the models are distributed under non-commercial CC BY-NC-SA 4.0. Documentation is available at https://ufal.mff.cuni.cz/nametag, source code at https://github.com/ufal/nametag3, and trained models via https://lindat.cz. The REST service and the web application can be found a
Představujeme NameTag 3, open-source nástroj a cloudovou webovou službu pro vícejazyčné, multidatasetové a multitagsetové rozpoznávání pojmenovaných entit (NER), podporující ploché i vnořené entity. NameTag 3 dosahuje state of the art výsledků na 21 testovacích datasetech v 15 jazycích a je konkurenceschopný i v ostatních jazycích, dokonce i oproti větším modelům. Je k dispozici jako nástroj příkazové řádky a jako cloudová služba, umožňující použití bez lokální instalace. Webová služba NameTag 3 v současné době poskytuje NER pro 17 jazyků trénovaný na 21 korpusech a třech NE tagsetech, všechny podporované jediným modelem o 355M parametrech; a vnořený NER pro češtinu, tvořený modelem s 126M parametry. Zdrojový kód je licencován pod open-source MPL 2.0, zatímco modely jsou distribuovány pod nekomerčním CC BY-NC-SA 4.0. Dokumentace je k dispozici na https://ufal.mff.cuni.cz/nametag, zdrojový kód na https://github.com/ufal/nametag3 a natrénované modely přes https://lindat.cz. Službu REST a webovou aplikac
Klíčová slova
nametag, tool, service, multilingual, multitagset
nametag, nástroj, služba, vícejazyčné, vícetagsetové, rozpoznávání, pojmenovaných, entit
Trvalý odkaz
https://hdl.handle.net/20.500.14178/3572Licence
Licence pro užití plného textu výsledku: Creative Commons Uveďte původ 4.0 International
