浏览器端本地运行语言模型 = Transformers.js + WebGPU + Phi-3

发表于2024-05-12|更新于2024-05-13|AI大模型

|字数总计:193|阅读时长:1分钟|阅读量:

介绍

Phi-3-mini-4k-instruction，这是一个38.2亿的参数LLM，它针对Web上的推理进行了优化。下载后，模型（2.3 GB）将被缓存，并在您重新访问页面时重用。

所有内容都直接在浏览器中运行，这意味着您的对话不会发送到服务器。🤗甚至可以在模型加载后断开与互联网的连接！

使用步骤

进入网址：点击进入

点击： load model，大约也就2个G多一点，下载完成后就可以正常使用啦。

大模型被缓存到浏览器里（按F12查看）

相关链接

文章作者: 罗布斯

文章链接: https://www.funning.top/article/112252.html

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自罗布斯！

大模型 AI web-gpu

赞助

wechat
alipay

相关推荐

革命性AI创新！一句话即可打造震撼120秒超长视频，免费开源，引爆你的创作激情！

META LLAMA 3 爆炸登场！在线试用、本地部署，性能直逼 GPT-4！

一键部署Google开源大模型Gemma，性能远超Mistral、LLama2 | 本地大模型部署，ollama助您轻松完成！

Add chat history 添加聊天记录

LangChain 完美兼容适配 MoonshotAI 国内AI，无需魔法即可调用，完美替代 OpenAI

Chat Models 聊天模型

评论

TwikooGitalk