kredor/punctuate-all

Token Classification·kredor· 521.4K· 28

transformers mit dataset:wmt/europarllicense:mitdeploy:azureregion:us

This is based on Oliver Guhr's work. The difference is that it is a finetuned xlm-roberta-base instead of an xlm-roberta-large and on twelve languages instead of four. The languages are: English, German, French, Spanish, Bulgarian, Italian, Polish, Dutch, Czech, Portugese, Slovak, Slovenian.

Open in MLForge Sign up free Desktop app Source ↗

# pull & run locally
pip install mlforge-sdk && mlforge pull kredor/punctuate-all

Model details

Task

Token Classification

Provider

kredor

Framework

transformers

Size

2.1 GB

License

mit

Downloads

521.4K

Likes

Updated

2024-04-26

About kredor/punctuate-all

Related Token Classification

I w11wo/indonesian-roberta-base-posp-tagger Token Classification ·124.1M params 2.8M 10 🤗 HF B dslim/bert-base-NER Token Classification ·108.3M params 1.8M 718 🤗 HF S StanfordAIMI/stanford-deidentifier-base Token Classification 1.3M 81 🤗 HF W Babelscape/wikineural-multilingual-ner Token Classification ·177.3M params 889.1K 165 🤗 HF F oliverguhr/fullstop-punctuation-multilang-large Token Classification 648.8K 178 🤗 HF X Davlan/xlm-roberta-large-ner-hrl Token Classification ·558.9M params 639.9K 15 🤗 HF