pytorch_pretrained_bert如何将tensorflow模型转化为pytorch模型

pytorch_pretrained_bert将tensorflow模型转化为pytorch模型

BERT仓库里的模型是TensorFlow版本的，需要进行相应的转换才能在pytorch中使用

在Google BERT仓库里下载需要的模型，这里使用的是中文预训练模型(chinese_L-12_H-768_A_12)

下载chinese_L-12_H-768_A-12.zip后解压，里面有5个文件

chinese_L-12_H-768_A-12.zip后解压，里面有5个文件

bert_config.json

bert_model.ckpt.data-00000-of-00001

bert_model.ckpt.index

bert_model.ckpt.meta

vocab.txt

使用bert仓库里的convert_bert_original_tf_checkpoint_to_pytorch.py将此模型转化为pytorch版本的，这里我的文件夹位置为：D:\Work\BISHE\BERT-Dureader\data\chinese_L-12_H-768_A-12，替换为自己的即可

python convert_tf_checkpoint_to_pytorch.py –tf_checkpoint_path D:\Work\BISHE\BERT-Dureader\data\chinese_L-12_H-768_A-12\bert_model.ckpt –bert_config_file D:\Work\BISHE\BERT-Dureader\data\chinese_L-12_H-768_A-12\bert_config.json –pytorch_dump_path D:\Work\BISHE\BERT-Dureader\data\chinese_L-12_H-768_A-12\pytorch_model.bin

注：这里让我疑惑的是模型有5个文件，为什么转化的时候使用的是bert_model.ckpt，而且这个文件也不存在呀，是我对TensorFlow的模型不太熟悉，查阅资料之后将5个文件的作用说明如下：

$ tree chinese_L-12_H-768_A-12/
chinese_L-12_H-768_A-12/
├── bert_config.json                     <- 模型配置文件
├── bert_model.ckpt.data-00000-of-00001  <- 保存断点文件列表，可以用来迅速查找最近一次的断点文件
├── bert_model.ckpt.index                <- 为数据文件提供索引，存储的核心内容是以tensor name为键以BundleEntry为值的表格entries，BundleEntry主要内容是权值的类型、形状、偏移、校验和等信息。
├── bert_model.ckpt.meta                 <- 是MetaGraphDef序列化的二进制文件，保存了网络结构相关的数据，包括graph_def和saver_def等
└── vocab.txt                            <- 模型词汇表文件

0 directories, 5 files

在调用模型时使用chinese_L-12_H-768_A-12\bert_model.ckpt即可。

TensorFlow 读取ckpt文件中的tensor，将ckpt模型转为pytorch模型

想用MobileNet V1训练自己的数据，发现pytorch没有MobileNet V1的预训练权重，只好先下载TensorFlow的预训练权重，再转成pytorch模型。

读取ckpt中的Tensor名称以及Tensor值

TensorFlow的MobileNet V1预训练权重文件如下：

pytorch_pretrained_bert如何将tensorflow模型转化为pytorch模型

解压完文件后，发现没有.ckpt文件，文件名只需‘./my_model/mobilenet_v1_1.0_224/mobilenet_v1_1.0_224.ckpt’这样写就行。

写一半发现Tensor名称好难对应起来。希望能给大家一个参考，也希望大家多多支持

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

pytorch_pretrained_bert如何将tensorflow模型转化为pytorch模型

pytorch_pretrained_bert将tensorflow模型转化为pytorch模型

TensorFlow 读取ckpt文件中的tensor，将ckpt模型转为pytorch模型

读取ckpt中的Tensor名称以及Tensor值

评论(0)

提示：请文明发言取消回复

作者信息

本站推荐

MySQL入门实战精讲视频课程数据库教程下载

刘恒《过路阴阳金锁玉关风水内部课程》

老黄2026餐饮店铺外卖商家实体店获客必修课

瑶瑶子2026伴手礼破局十大攻略解决核心难题

杨亮考研英语5500词汇精讲+词汇讲义课

袁春楠《让你脱胎换骨的人生整理术》

热门资源

苹果cms海螺影视模板/大橙子模板/仿B站模板/v7模板/带手机移动端+详细安装使用说明

【已测】修复版H5骰子微信竞猜游戏骰宝免公众号版修复登录ID相同完美全套源码对接免签支付

网页游戏卧龙吟一键服务端加远程工具带架设教程

邪风曲单机版 2D回合制网络游戏源码一键安装即玩服务端公益服+GM工具

完整可用版本去水印小程序源码带教程源码

仙侠H5【苍穹剑诀】一键即玩端+授权后台+外网教程

pytorch_pretrained_bert如何将tensorflow模型转化为pytorch模型

pytorch_pretrained_bert将tensorflow模型转化为pytorch模型

TensorFlow 读取ckpt文件中的tensor，将ckpt模型转为pytorch模型

读取ckpt中的Tensor名称以及Tensor值

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

本站推荐

热门资源

提示：请文明发言取消回复