Salesforce/blip-image-captioning-large

Image To Text·Salesforce· 737.4K· 1.5K

transformers bsd-3-clause 469.7M params arxiv:2201.12086license:bsd-3-clauseregion:us

BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation

# pull & run locally
pip install mlforge-sdk && mlforge pull Salesforce/blip-image-captioning-large

Model details

Task

Image To Text

Provider

Salesforce

Framework

transformers

Parameters

469.7M

Size

7.0 GB

License

bsd-3-clause

Downloads

737.4K

Likes

1.5K

Paper

arXiv:2201.12086

Updated

2025-02-03

BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation