在树莓派中跑迷你Llama2中文模型

2023-08-20 16:25 由 AiFly 发表于 #后端开发

OpenAI的Karpathy利用周末搞了一个迷你Llama2项目llama2.c用500行C语言实现无任何依赖项的推理程序，此项目在github发布以来衍生出了基于各种语言的迷你Llama推理实现llama2.go、llama2.java、llama2.py等等；
但该项目原本的模型并不支持中文，最近正好看到一个基于llama2的中文训练模型；想着把它跑在树莓派上速度会怎样；
使用Go实现进行模型推理，该在树莓派中的Llama2 迷你中文模型，模型大小为15M使用的数据集为TinyStories 英文翻译后的数据但仅翻译了TinyStories 的部分数据目前为1M，中文词表使用UTF-8编码所以每个汉字为3个字节；

在树莓派中推理：

 ./llama2.go -checkpoint=stories15M-llama2-enzh.bin -tokenizer=tokenizer.bin -prompt="有个小姑娘" 
2023/08/20 15:43:55 config: llama2.Config{Dim:288, HiddenDim:768, NumLayers:6, NumHeads:6, NumKVHeads:6,VocabSize:55296, SeqLen:256}
 有个小姑娘。她正忙着在公园里玩耍。突然，她摔倒了，膝盖受伤了。她需要举起膝盖。
 她的父母提醒她保持冷静，然后乔把她救回她的安全位置。他们给了她一些创可贴，并告诉她会帮助她感觉好一点。
 小乔紧紧地抱住膝盖，微笑着。她相信她的父母会帮助她感觉更好。
 最终，收拾好竭，她的膝盖感觉好多了。她很高兴能能够再次感到安全。

可以看到在树莓派中跑这个150万参数的llama2模型Tokens/s速度只有每秒不到10；
由于TinyStories只是短篇故事数据集，加上中文翻译数据集也不完全，模型参数也只有百万规模所以讲故事的效果并不好；

Go推理fork于：https://github.com/nikolaydubina/llama2.go
模型、词表来源：https://github.com/chenyangMl/llama2.c-zh
文章首发地址：https://mp.weixin.qq.com/s/3jHg6kYFnd45JUZq9WK3sw

热门相关：豪门蜜爱：独宠天后小萌妻本法官萌萌哒未来兽世：买来的媳妇，不生崽豪门情变，渣总裁滚远点！今天也没变成玩偶呢

相关文章

Anaconda安装与配置（Python环境及库依赖）

## 一，下载安装相关 ### 1，这个软件什么作用？ Anaconda：Python大礼包（包含解析器，一系列库，软件包管理器Conda）主要作用，不用配库，如果需要库a，anaconda会把库a相关的依赖库一并打包下载次要作用，可以同时安装不同版本的python，和对应依赖库，相互隔离。 # ...阅读全文

桌面版vscode用免费的微软4核8G服务器做远程开发（编译运行都在云上，还能自由创建docker服务）

GitHub的Codespaces为个人用户提供了免费的4核8G服务器资源，今天就来实战如何用桌面版vscode连接codespace服务器做远程开发，把编译运行下载等耗时耗资源的操作都转移到云端进行，还能为应用创建各种docker服务，这都不要钱！ ...阅读全文

2.如何选择go语言基础类型——Leetcode习题9

[TOC] # 本篇前瞻欢迎来go语言的基础篇，这里会帮你梳理一下go语言的基本类型，注意本篇有参考[go圣经](https://gopl-zh.github.io/)，如果你有完整学习的需求可以看一下。另外，go语言的基本类型比较简单，介绍过程就比较粗暴，不过我们需要先从一个例题开始。 # Le ...阅读全文

Kafka+Fink 实战+工具类

- LogServiceImpl ``` @Service @Slf4j public class LogServiceImpl implements LogService { private static final String TOPIC_NAME = "ods_link_visit_topi ...阅读全文

Deno 中使用 @typescript/vfs 生成 DTS 文件

## 背景前段时间开源的 [STC](https://github.com/long-woo/stc) 工具，这是一个将 OpenApi 规范的 Swagger/Apifox 文档转换成代码的工具。可以在上一篇（[《OpenApi（Swagger）快速转换成 TypeScript 代码 - STC ...阅读全文

2.go语言基础类型漫游

# 本篇前瞻本篇是go语言的基础篇，主要是帮助大家梳理一下go语言的基本类型，注意本篇有参考[go圣经](https://gopl-zh.github.io)，如果你有完整学习的需求可以看一下，另外，go语言的基本类型比较简单，介绍过程就比较粗暴。 # 基本类型 ## 整形这个不是韩国的“绝学” ...阅读全文

部署Kafka+ZK及其日志采集实战(系统版本：linux_CentOs_7.8)

- 部署ZK ``` docker run -d --name zookeeper -p 2181:2181 -t wurstmeister/zookeeper ``` - 部署Kafka ``` docker run -d --name xdclass_kafka \ -p 9092:9092 \ ...阅读全文

注册中心/配置管理 —— SpringCloud Consul

## Consul 概述 Consul 是一个可以提供服务发现，健康检查，多数据中心，key/Value 存储的分布式服务框架，用于实现分布式系统的发现与配置。Cousul 使用 Go 语言实现，因此天然具有可移植性，安装包仅包含一个可执行文件，直接启动即可运行，方便部署 ## Consul 安装与 ...阅读全文

Python程序员Visual Studio Code指南2 Hello World

#2 Hello World ## 2.1 安装Python扩展 Visual Studio Code的Python 扩展提供了对Python语言的支持，包括语法着色、代码补全、过滤、调试、代码导航和代码格式化等功能，以及Jupyter Notebook支持等Python特有的功能。您可以在Visu ...阅读全文

Codespaces个性化后台服务器配置指南

当您拥有了Codespaces之后，可能还需要做一些深度定制，让免费服务器预装一些适合你特定需求的内容，请随本篇一同实战如何实现后台服务器的个性化配置 ...阅读全文