Hugging Face推出最小AI視覺語言模型

Hugging Face平臺于1月23日發(fā)布博文，推出了兩款令人矚目的輕量級AI模型——SmolVLM-256M-Instruct和SmolVLM-500M-Instruct。

其中，SmolVLM-256M-Instruct僅有2.56億參數(shù)，是有史以來發(fā)布的最小視覺語言模型，可在內存低于1GB的PC上運行并提供卓越性能。SmolVLM-500M-Instruct有5億參數(shù)，主要針對硬件資源限制，幫助開發(fā)者應對大規(guī)模數(shù)據(jù)分析挑戰(zhàn)。

這兩款模型具備先進的多模態(tài)能力，可執(zhí)行圖像描述、短視頻分析以及回答關于PDF或科學圖表的問題等任務。其開發(fā)依賴于The Cauldron和Docmatix兩個專有數(shù)據(jù)集。The Cauldron包含50個高質量圖像和文本數(shù)據(jù)集，側重于多模態(tài)學習；Docmatix專為文檔理解定制，將掃描文件與詳細標題配對以增強理解。

此外，模型采用了更小的視覺編碼器SigLIP base patch-16/512，通過優(yōu)化圖像標記處理方式，減少了冗余，還將圖像編碼速率提升至每個標記4096像素，相比早期版本的每標記1820像素有了顯著改進。

Hugging Face此次推出的最小AI視覺語言模型，為AI在低資源設備上的應用開辟了新的道路。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1806

文章
48972

瀏覽量
248721
語言模型

語言模型

+關注

關注
0

文章
561

瀏覽量
10763
AI視覺

AI視覺

+關注

關注
0

文章
87

瀏覽量
4777

麥辣雞腿堡
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 麒麟9000s相當于驍龍多少和驍龍多少處理器相當
Hot 華為麒麟9000s是多少納米的麒麟9000s什么檔次

New 15KV ESD保護 RS-232發(fā)射器/接收器ICL3237E數(shù)據(jù)手冊
New ICL3223 1A電源電流250kbps RS-232發(fā)射器/接收器數(shù)據(jù)手冊

精選推薦
更多

文章

資料

帖子

通過vmRT-Thread和vSOME/IP支持車載SOA開發(fā) | 前沿觀點

RT-Thread官方賬號
3小時前

163 閱讀

圖像信號分析處理卡設計原理圖：536-基于FMC接口的XCZU7EV 通用PCIe卡視覺處理卡工業(yè)控制卡

hexiaoyan510
1小時前

117 閱讀

基于TSV的三維集成電路制造技術

中科院半導體所
2小時前

170 閱讀

Linux下BIND安裝與配置詳解

馬哥Linux運維
3小時前

177 閱讀

三相四線變換器拓撲與原理簡介

英飛凌工業(yè)半導體
17小時前

198 閱讀

接入網(wǎng)技術教材(北京郵電)

芭蕉叔
4.38 MB

免費

0下載

基于SC630A_Typical Application直流到直流單輸出電源的參考設計

劉杰
395.56KB

3積分

11下載

FlatUI Colors Palette for XCode的FlatUI顏色調色板

賈熹
0.08 MB

2積分

1下載

LiteWebChat_frame輕網(wǎng)頁聊天框架

h1654155275.5741
0.07 MB

2積分

1下載

Waifu2x-Extension-GUI機器學習多媒體處理應用

凌流浪
75.68 MB

免費

0下載

《電子發(fā)燒友電子設計周報》聚焦硬科技領域核心價值第18期：2025.06.30--2025.07.4

電子人steve
4天前

649 閱讀

【Milk-V Duo S 開發(fā)板免費體驗】2 - 安裝編譯環(huán)境并測試Hello world!

zealsoft
1天前

107 閱讀

每周推薦！硬件設計指南+無刷電機原理圖大全+工程師面試題庫匯總

ElecFans小喇叭
1天前

269 閱讀

【潤開鴻HH-SCDAYU800A開發(fā)板試用體驗】潤開鴻HH-SCDAYU800A開發(fā)板（三）

jf_29910226
1天前

476 閱讀

【VisionFive 2單板計算機試用體驗】RISC-V架構卡片計算機初體驗

xinglong01
2天前

551 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

搜索歷史

Hugging Face推出最小AI視覺語言模型

評論