女人荫蒂被添全过程13种图片,亚洲+欧美+在线,欧洲精品无码一区二区三区 ,在厨房拨开内裤进入毛片

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用OpenVINO運(yùn)行DeepSeek-R1蒸餾模型

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2025-03-12 13:45 ? 次閱讀

作者:

張晶英特爾創(chuàng)新大使

李翊瑋英特爾開發(fā)者技術(shù)推廣工程師

DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開發(fā)的開源推理模型,用于解決需要邏輯推理、數(shù)學(xué)問題解決和實(shí)時(shí)決策的任務(wù)。使用 DeepSeek-R1,您可以遵循其邏輯,使其更易于理解,并在必要時(shí)對(duì)其輸出提出質(zhì)疑。此功能使推理模型在需要解釋結(jié)果的領(lǐng)域(如研究或復(fù)雜決策)中具有優(yōu)勢。AI 中的蒸餾從較大的模型創(chuàng)建更小、更高效的模型,在減少計(jì)算需求的同時(shí)保留了大部分推理能力。DeepSeek 應(yīng)用了這項(xiàng)技術(shù),使用 Qwen 和 Llama 架構(gòu)從 R1 創(chuàng)建了一套提煉的模型。這使我們能夠在普通筆記本電腦上本地試用 DeepSeek-R1 功能。在本教程中,我們將研究如何使用 OpenVINO 運(yùn)行 DeepSeek-R1 蒸餾模型。

在創(chuàng)新大使的文章《趕緊在本地運(yùn)行與OpenAI-o1能力近似的DeepSeek-R1模型》也收到了讀者的熱烈反饋。很多讀者問:DeepSeek-R1除了部署在RTX-4060上,能否部署到英特爾Ultra Core 的CPUGPU或NPU上?

本文將基于OpenVINO GenAI庫,介紹使用三行Python代碼,將DeepSeek-R1模型到英特爾酷睿Ultra CPU、GPU或NPU的完整過程。

趕緊在本地運(yùn)行與OpenAI-o1能力近似的DeepSeek-R1模型

https://mp.weixin.qq.com/s/Nu6ovClNOAfhXa-exnlWdg

OpenVINO GenAI庫

https://mp.weixin.qq.com/s/1nwi3qJDqAkIXnrGQnP3Rg

1硬件介紹

本文是用KHARAS深圳市世野科技(https://www.khadas.com/product-page/mind-maker-kit-lnl)提供基于英特爾酷睿Ultra的AI PC,只有435g, 以下為其參數(shù):

44c158c0-fb35-11ef-9310-92fbcf53809c.png ? ?

主要特點(diǎn)

oIntel Core Ultra Processor Series 2

oAI Performance: up to 115 TOPS

oNPU: 4.0 AI Engine, up to 47 TOPS

oGPU: Intel Arc 140V, up to 64 TOPS

o32GB LPDDR5X Memory, 1TB PCIe SSD

oCopilot+ PC: Windows AI assistant

oBattery Life Optimization

oWiFi+ Bluetooth: AX211D2

應(yīng)用場景

AI PC 開發(fā)

o 以 AI 為中心的硬件和軟件的進(jìn)步使 AI 在 PC 上成為可能。將項(xiàng)目從早期 AI 開發(fā)無縫過渡到基于云的訓(xùn)練和邊緣部署。

多個(gè)處理器中的 AI 加速

o 英特爾 酷睿 Ultra 7 258V 處理器通過混合架構(gòu)將 CPU、GPU 和 NPU 相結(jié)合,并通過高帶寬內(nèi)存和緩存進(jìn)行增強(qiáng),從而加速 AI。

Intel AI PC 開發(fā)支持

o 通過針對(duì) Intel CPU 和 GPU 優(yōu)化的 OpenVINO 工具包和 ONNX 運(yùn)行時(shí)獲得 Intel 官方支持。

2什么是OpenVINOGenAI庫?

回到標(biāo)題, 我們將用OpenVINO GenAI庫基于OpenVINO 工具套件和運(yùn)行時(shí),提供C++/Python API,支持生成式AI模型在英特爾硬件平臺(tái)上快速部署。

44e41626-fb35-11ef-9310-92fbcf53809c.png

OpenVINO GenAI庫

https://mp.weixin.qq.com/s/1nwi3qJDqAkIXnrGQnP3Rg

OpenVINO 工具套件

https://mp.weixin.qq.com/s/fORowUzzcPSVIO6AieoUKA

Github倉:https://github.com/openvinotoolkit/openvino.genai

3搭建OpenVINOGenAI開發(fā)環(huán)境

只需兩條安裝命令,即可完成OpenVINO GenAI開發(fā)環(huán)境的搭建:

# 安裝OpenVINO GenAI
pip install openvino-genai
# 安裝optimum-intel,用于轉(zhuǎn)換并量化生成式AI模型
pip install pip install optimum-intel[openvino]

4下載并量化DeepSeek-R1模型

請(qǐng)先使用下面的命令,從ModelScope下載DeepSeek-R1-Distill-Qwen-1.5B模型到本地:

# 安裝ModelScope
pip install modelscope
# 下載DeepSeek-R1-Distill-Qwen-1.5B模型
modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

45005d4a-fb35-11ef-9310-92fbcf53809c.png

5使用 Optimum-CLI 工具轉(zhuǎn)換模型

本文使用optimum-intel命令,將DeepSeek-R1-Distill-Qwen-1.5B PyTorch格式模型轉(zhuǎn)換為OpenVINO IR格式模型,并完成FP16、INT8或INT4量化。

Optimum Intel 是 Transformers 和 Diffusers 庫與 OpenVINO 之間的接口,用于加速 Intel 架構(gòu)上的端到端管道。它提供易于使用的 cli 界面,用于將模型導(dǎo)出為 OpenVINO 中間表示 (IR)格式。

以下命令演示了使用optimum-cli 導(dǎo)出模型的基本命令

optimum-cli export openvino --model--task <任務(wù)>

其中--model 參數(shù)是 HuggingFace Hub 中的模型 ID 或帶有 model 的本地目錄(使用 .save_pretrained 方法保存),--task 是導(dǎo)出的模型應(yīng)該解決的支持任務(wù)之一。對(duì)于 LLM,建議使用 text-generation-with-past。如果模型初始化需要使用遠(yuǎn)程代碼,則應(yīng)額外傳遞--trust-remote-code 標(biāo)志。

optimum-cli export openvino --model d:DeepSeek-R1-Distill-Qwen-1___5B --task text-generation-with-past --weight-format int4 --group-size 128 --ratio 0.8 --sym d:dsr1_int4
optimum-cli export openvino --model d:DeepSeek-R1-Distill-Qwen-1___5B --task text-generation-with-past --weight-format int8 d:dsr1_int8
optimum-cli export openvino --model d:DeepSeek-R1-Distill-Qwen-1___5B --task text-generation-with-past --weight-format fp16 d:dsr1_fp16

設(shè)置 --weight-format 分別為 fp16、int8 或 int4。這種類型的優(yōu)化可以減少內(nèi)存占用和推理延遲。默認(rèn)情況下,int8/int4 的量化方案是非對(duì)稱的,要使其對(duì)稱化,您可以添加 --sym。

對(duì)于 INT4 量化,您還可以指定以下參數(shù):

--group-size 參數(shù)將定義用于量化的組大小,-1 將導(dǎo)致每列量化。

--ratio 參數(shù)控制 4 位和 8 位量化之間的比率。如果設(shè)置為 0.9,則意味著 90% 的層將被量化為 int4,而 10% 的層將被量化為 int8。

較小的 group_size 和 ratio 值通常會(huì)以犧牲模型大小和推理延遲為代價(jià)來提高準(zhǔn)確性。您可以使用 --awq 標(biāo)志啟用在模型導(dǎo)出期間以 INT4 精度額外應(yīng)用 AWQ,并使用 --datasetparameter 提供數(shù)據(jù)集名稱(例如 --dataset wikitext2)

注意:

1. 應(yīng)用 AWQ 需要大量的內(nèi)存和時(shí)間。

2. 模型中可能沒有匹配的模式來應(yīng)用 AWQ,在這種情況下,將跳過它。

45202d1e-fb35-11ef-9310-92fbcf53809c.png

6編寫DeepSeek-R1的推理程序

獲得DeepSeek-R1的OpenVINO IR模型后,即可使用OpenVINO GenAI庫編寫推理程序,僅需三行Python代碼,如下所示:

import openvino_genai
#Will run model on CPU, GPU or NPU are possible options
pipe = openvino_genai.LLMPipeline("D:dsr1_int4", "GPU")
print(pipe.generate("Prove the Pythagorean theorem.", max_new_tokens=4096))

運(yùn)行視頻如下所示:

7總結(jié)

使用OpenVINO GenAI庫可以方便快捷的將生成式AI模型本地化部署到英特爾 酷睿Ultra CPU、GPU或NPU上。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10177

    瀏覽量

    174062
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11051

    瀏覽量

    216176
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3499

    瀏覽量

    50082
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    114

    瀏覽量

    428
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    783

    瀏覽量

    1439

原文標(biāo)題:開發(fā)者實(shí)戰(zhàn)|用英特爾? 酷睿? Ultra及OpenVINO? GenAI本地部署DeepSeek-R1

文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個(gè)不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場景、能力側(cè)重和技術(shù)優(yōu)化方向上。以下是二者的實(shí)
    發(fā)表于 02-14 02:08

    RK3588開發(fā)板上部署DeepSeek-R1模型的完整指南

    的核心功能之一,它允許用戶將Hugging Face或GGUF格式的大語言模型轉(zhuǎn)換為RKLLM模型,從而將RKLLM模型在Rockchip NPU上加載運(yùn)行。 (4)編譯
    發(fā)表于 02-27 16:45

    《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值 第3期:2025.03.10--2025.03.14

    2、RK3588開發(fā)板技術(shù)分享 TF卡燒寫大于4G容量鏡像 3、恩智浦Zephyr調(diào)試技巧 開源項(xiàng)目與實(shí)戰(zhàn)干貨 : 1、使用OpenVINO運(yùn)行DeepSeek-R1
    發(fā)表于 03-14 18:00

    對(duì)標(biāo)OpenAI o1,DeepSeek-R1發(fā)布

    今天,我們正式發(fā)布 DeepSeek-R1,并同步開源模型權(quán)重。 DeepSeek-R1 遵循 MIT License,允許用戶通過蒸餾技術(shù)借助 R
    的頭像 發(fā)表于 01-22 13:46 ?1776次閱讀
    對(duì)標(biāo)OpenAI o<b class='flag-5'>1</b>,<b class='flag-5'>DeepSeek-R1</b>發(fā)布

    網(wǎng)易有道全面接入DeepSeek-R1模型

    近日,網(wǎng)易有道宣布了一個(gè)重要決定,即全面接入DeepSeek-R1模型。這一舉措標(biāo)志著網(wǎng)易有道在AI技術(shù)方面邁出了重要一步,將為用戶帶來更加智能化、個(gè)性化的學(xué)習(xí)體驗(yàn)。 據(jù)悉,網(wǎng)易有道將以
    的頭像 發(fā)表于 02-07 14:42 ?988次閱讀

    DeepSeek-R1全尺寸版本上線Gitee AI

    DeepSeek 全套蒸餾模型以及 V3 版本上線后,經(jīng)過 Gitee AI 和沐曦團(tuán)隊(duì)兩天緊鑼密鼓的適配和機(jī)器籌備,DeepSeek-R1全尺寸版本現(xiàn)在已上線 Gitee AI
    的頭像 發(fā)表于 02-07 15:25 ?1077次閱讀

    芯動(dòng)力神速適配DeepSeek-R1模型,AI芯片設(shè)計(jì)邁入“快車道”!

    近期,國產(chǎn)大模型 DeepSeek-R1橫空出世,迅速成為AI領(lǐng)域的焦點(diǎn)。 芯動(dòng)力在24小時(shí)內(nèi)完成了與DeepSeek-R1模型的適配。 Deep
    的頭像 發(fā)表于 02-07 16:55 ?553次閱讀
    芯動(dòng)力神速適配<b class='flag-5'>DeepSeek-R1</b>大<b class='flag-5'>模型</b>,AI芯片設(shè)計(jì)邁入“快車道”!

    deepin UOS AI接入DeepSeek-R1模型

    DeepSeek-R1 模型自發(fā)布以來吸引了眾多用戶關(guān)注,為了讓 deepin 用戶更好地體驗(yàn)這一前沿技術(shù),UOS AI 現(xiàn)已適配接入 DeepSeek-R1 端側(cè)模型!無需忍受服務(wù)器
    的頭像 發(fā)表于 02-08 09:52 ?920次閱讀

    AIBOX 全系產(chǎn)品已適配 DeepSeek-R1

    DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力,目前基于開源的R1模型具有1.5B-70B可選,這些
    的頭像 發(fā)表于 02-08 17:30 ?516次閱讀
    AIBOX 全系產(chǎn)品已適配 <b class='flag-5'>DeepSeek-R1</b>

    廣和通支持DeepSeek-R1蒸餾模型

    近期,國產(chǎn)大模型DeepSeek憑借開放性、更低訓(xùn)練成本、端側(cè)部署等優(yōu)勢,迅速成為增速最快的AI應(yīng)用之一,推動(dòng)AI普惠化。目前,廣和通高算力AI模組及解決方案全面支持小尺寸的DeepSeek-R1
    的頭像 發(fā)表于 02-11 09:41 ?531次閱讀

    Deepseek R1模型離線部署教程

    。作為國產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。 本文主要說明DeepSeek-R1如何離線運(yùn)行在EASY-EAI-Orin-Nano(RK3576)硬件上, RK357
    的頭像 發(fā)表于 02-12 09:37 ?1639次閱讀
    <b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>離線部署教程

    超星未來驚蟄R1芯片適配DeepSeek-R1模型

    日前,超星未來研發(fā)團(tuán)隊(duì)成功完成了驚蟄R1芯片對(duì)DeepSeek-R1模型的適配工作,實(shí)現(xiàn)了與用戶之間的流暢對(duì)話。這一成果標(biāo)志著超星未來在人工智能芯片和模型優(yōu)化方面取得了重要進(jìn)展
    的頭像 發(fā)表于 02-13 14:05 ?577次閱讀

    香橙派發(fā)布OrangePi AIpro(20T)本地部署Deepseek-R1蒸餾模型指南!

    日前,香橙派官方發(fā)布OrangePiAIpro(20T)運(yùn)行Deepseek-R1蒸餾模型實(shí)操指南,幫助用戶通過先進(jìn)算力和硬件架構(gòu)實(shí)現(xiàn)高效的端側(cè)智能。OrangePiAIpro(20T
    的頭像 發(fā)表于 02-14 16:29 ?1162次閱讀
    香橙派發(fā)布OrangePi AIpro(20T)本地部署<b class='flag-5'>Deepseek-R1</b><b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>指南!

    香橙派發(fā)布OrangePi 5Plus本地部署Deepseek-R1蒸餾模型指南

    派官方發(fā)布OrangePi5Plus運(yùn)行Deepseek-R1蒸餾模型實(shí)操指南,趕緊收藏起來吧!OrangePi5Plus采用了瑞芯微RK3588八核64位處理器
    的頭像 發(fā)表于 02-19 16:14 ?1030次閱讀
    香橙派發(fā)布OrangePi 5Plus本地部署<b class='flag-5'>Deepseek-R1</b><b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>指南

    香橙派發(fā)布OrangePi RV2本地部署Deepseek-R1蒸餾模型指南

    繼香橙派昇騰系列產(chǎn)品、OrangePi5系列產(chǎn)品完成與DeepSeek模型的深度適配之后,香橙派日前官方發(fā)布OrangePiRV2運(yùn)行Deepseek-R1
    的頭像 發(fā)表于 03-28 11:55 ?581次閱讀
    香橙派發(fā)布OrangePi RV2本地部署<b class='flag-5'>Deepseek-R1</b><b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>指南
    主站蜘蛛池模板: 阜新| 永仁县| 平乐县| 镇江市| 栾城县| 盐津县| 抚松县| 安仁县| 沙田区| 阿尔山市| 青田县| 阳山县| 武威市| 滦南县| 丰镇市| 德安县| 常宁市| 九寨沟县| 满城县| 搜索| 调兵山市| 德清县| 山东省| 阳山县| 肇源县| 清流县| 海安县| 农安县| 玉树县| 五家渠市| 元朗区| 博白县| 普格县| 兴宁市| 四会市| 和顺县| 玉屏| 普兰县| 南乐县| 岳西县| 泽州县|