无版权图片做网站,专业网站建设网页推广,怎么用代码做网站,人才网网站模板本文主要介绍通过python实现tokens统计,避免重复调用openai等官方api,开源节流。 一、设计思路 初始化tokenizer使用tokenizer将文本转换为tokens计算token的数量二、业务场景
2.1 首次加载依赖 2.2 执行业务逻辑 三、核心代码
from transformers import AutoTokenizer
imp… 本文主要介绍通过python实现tokens统计,避免重复调用openai等官方api,开源节流。 一、设计思路
初始化tokenizer使用tokenizer将文本转换为tokens计算token的数量二、业务场景
2.1 首次加载依赖 2.2 执行业务逻辑 三、核心代码
from transformers import AutoTokenizer
import time
from datetime import datetime# 获取开始时间,并格式化为"年-月-日 时:分:秒"
start_time = time.time()
start_datetime = datetime.fromtimestamp(start_time).strftime('%Y-%m-%d %H:%M:%S')# 初始化tokenizer
tokenizer = AutoTokenizer.from_pretrained('bert-base-uncased')# 示例文本
text = "ChatGPT is great!"# 使用t