gliner_de_en_news is a model for named entity extraction (NER) based off of the GLiNER architecture (https://github.com/urchade/GLiNER) It was trained on a dataset of public news in German and English (Dataset not disclosed yet)
Supported entity types are:
- Person
- Location
- Organization
- Event
- Product
- Address
- URL
Installation
Install the gliner package via pip:
pip install gliner
Usage
Example usage:
from gliner import GLiNER
labels = ["Person", "Location", "Organization", "Event", "Product", "Address", "URL"]
news_en = """On September 1, 2025, OrionSoft Inc., a California-based technology company, announced the opening of its new Artificial Intelligence Research Lab in Vienna, Austria.
The CEO, Dr. Laura Stein, explained during a press conference at the Hotel Imperial that the lab will focus on multilingual natural language processing and AI ethics. The project is being supported by the Austrian Federal Ministry for Digital Affairs and will collaborate closely with TU Wien and Oxford University.
According to Stein, OrionSoft plans to hire more than 120 researchers in the next two years, with the first products expected under the Aurora AI brand by mid-2026."""
news_de = """Am 1. September 2025 hat der in Kalifornien ansässige Technologiekonzern OrionSoft Inc. die Eröffnung seines neuen Forschungszentrums für Künstliche Intelligenz in Wien, Österreich bekanntgegeben.
Die Geschäftsführerin, Dr. Laura Stein, erklärte auf einer Pressekonferenz im Hotel Imperial, dass sich das Labor auf mehrsprachige Sprachverarbeitung und KI-Ethik konzentrieren werde. Unterstützt wird das Projekt vom Bundesministerium für Digitalisierung und in enger Zusammenarbeit mit der TU Wien sowie der Universität Oxford.
Laut Stein will OrionSoft in den nächsten zwei Jahren mehr als 120 Forscherinnen und Forscher einstellen. Erste Produkte sollen bereits Mitte 2026 unter der Marke Aurora AI erscheinen."""
model = GLiNER.from_pretrained("llinauer/gliner_de_en_news")
ents_de = model.predict_entities(news_de, labels)
ents_en = model.predict_entities(news_en, labels)
print({f'{e["text"]}:{e["label"]}' for e in ents_de})
>>> {'Österreich:Location', 'Wien:Location', 'OrionSoft:Organization', 'Aurora AI:Product', 'Universität Oxford:Organization', 'TU Wien:Organization', 'Hotel Imperial:Location', 'Labor:Location', 'Laura Stein:Person', 'Stein:Person', 'Bundesministerium für Digitalisierung:Organization', 'Kalifornien:Location', 'OrionSoft Inc.:Organization', 'Pressekonferenz:Event'}
print({f'{e["text"]}:{e["label"]}' for e in ents_en})
>>> {'California-based:Location', 'Austria:Location', 'Austrian Federal Ministry for Digital Affairs:Organization', 'Artificial Intelligence Research Lab:Location', 'Aurora AI:Product', 'TU Wien:Organization', 'press conference:Event', 'Hotel Imperial:Location', 'Laura Stein:Person', 'Oxford University:Organization', 'Vienna:Location', 'Stein:Person', 'OrionSoft:Organization', 'OrionSoft Inc.:Organization', 'lab:Location'}
Model tree for taranis-ai/gliner_de_en_news
Base model
urchade/gliner_multi-v2.1