通用信息抽取大模型 PP-UIE#
目录
1. 模型简介
2. 开箱即用
2.1 实体抽取
2.2 关系抽取
2.3 模型选择
2.4 更多配置
3. 训练定制
3.1 代码结构
3.2 数据标注
3.3 模型微调
3.4 定制模型一键预测
3.5 实验指标
1. 模型简介#
通用信息抽取大模型(PP-UIE)是 PaddleNLP 团队基于开源模型和高质量数据集构建的通用信息抽取大模型, PaddleNLP 基于百度 UIE 的建模思路,通过大模型的能力来训练并开源了一款面向中、英文通用信息抽取的大模型。 支持统一训练信息抽取任务包括命名实体识别(NER),关系抽取(RE)和事件抽取(EE)。模型共包含0.5B、1.5B、7B 和14B 共4个版本,以适配不同场景下信息抽取任务使用。在多个数据集(包含 Boson、CLUENER、CCIR2021等常见数据)相比其他通用信息抽取大模型在 ACC 和 F1 指标上有大幅度提升。
2. 开箱即用#
paddlenlp.Taskflow提供通用信息抽取等能力,可抽取多种类型的信息,包括但不限于命名实体识别(如人名、地名、机构名等)、关系(如电影的导演、歌曲的发行时间等)、事件(如某路口发生车祸、某地发生地震等)等信息。用户可以使用自然语言自定义抽取目标,无需训练即可统一抽取输入文本中的对应信息。实现开箱即用,并满足各类信息抽取需求
2.1 实体抽取#
命名实体识别(Named Entity Recognition,简称 NER),是指识别文本中具有特定意义的实体。在开放域信息抽取中,抽取的类别没有限制,用户可以自己定义。
例如抽取的目标实体类型是"时间"、"选手"和"赛事名称", schema 构造如下:
['时间', '选手', '赛事名称']
调用示例:
from pprint import pprint
from paddlenlp import Taskflow
schema = ['时间', '选手', '赛事名称'] # Define the schema for entity extraction
ie = Taskflow('information_extraction',
schema= ['时间', '选手', '赛事名称'],
schema_lang="zh",
batch_size=1,
model='paddlenlp/PP-UIE-0.5B',
precision='float16')
pprint(ie("2月8日上午北京冬奥会自由式滑雪女子大跳台决赛中中国选手谷爱凌以188.25分获得金牌!")) # Better print results using pprint
# 输出
[{'时间': [{'text': '2月8日上午'}],
'赛事名称': [{'text': '北京冬奥会自由式滑雪女子大跳台决赛'}],
'选手': [{'text': '谷爱凌'}]}]
2.2 关系抽取#
关系抽取(Relation Extraction,简称 RE),是指从文本中识别实体并抽取实体之间的语义关系,进而获取三元组信息,即<主体,谓语,客体>。
例如以"竞赛名称"作为抽取主体,抽取关系类型为"主办方"、"承办方"和"时间", schema 构造如下:
{
'竞赛名称': [
'主办方',
'承办方',
'时间'
]
}
调用示例:
schema = {'竞赛名称': ['主办方', '承办方', '时间']} # Define the schema for relation extraction
ie.set_schema(schema) # Reset schema
pprint(ie('2022年语言与智能技术竞赛由中国中文信息学会和中国计算机学会联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办,已连续举办4届,成为全球最热门的中文NLP赛事之一。'))
# 输出
[{'竞赛名称': [{'relations': {'主办方': [{'text': '中国中文信息学会,中国计算机学会'}],
'时间': [{'text': '2022年'}],
'承办方': [{'text': '百度公司,中国中文信息学会评测工作委员会,中国计算机学会自然语言处理专委会'}]},
'text': '语言与智能技术竞赛'}]}]
2.3 模型选择#
多模型选择,满足精度、速度要求
模型
结构
语言
paddlenlp/PP-UIE-0.5B
24-layers, 896-hidden, 14-heads
中、英文
paddlenlp/PP-UIE-1.5B
28-layers, 1536-hidden, 12-heads
中、英文
paddlenlp/PP-UIE-7B
28-layers, 3584-hidden, 28-heads
中、英文
paddlenlp/PP-UIE-14B
48-layers, 5120-hidden, 40-heads
中、英文
2.4 更多配置#
>>> from paddlenlp import Taskflow
>>> ie = Taskflow('information_extraction',
schema = {'竞赛名称': ['主办方', '承办方', '时间']},
schema_lang="zh",
batch_size=1,
model='paddlenlp/PP-UIE-0.5B',
precision='float16')
schema:定义任务抽取目标,可参考开箱即用中不同任务的调用示例进行配置。
schema_lang:设置 schema 的语言,默认为zh, 可选有zh和en。因为中英 schema 的构造有所不同,因此需要指定 schema 的语言。
batch_size:批处理大小,请结合机器情况进行调整,默认为1。
model:选择任务使用的模型,可选有paddlenlp/PP-UIE-0.5B, paddlenlp/PP-UIE-1.5B, paddlenlp/PP-UIE-7B, paddlenlp/PP-UIE-14B。
precision:选择模型精度,默认为float16,可选有float16、bfloat16和float32和。如果选择float16,在 GPU 硬件环境下,请先确保机器正确安装 NVIDIA 相关驱动和基础软件,确保 CUDA>=11.2,cuDNN>=8.1.1,初次使用需按照提示安装相关依赖。其次,需要确保 GPU 设备的 CUDA 计算能力(CUDA Compute Capability)大于7.0,典型的设备包括 V100、T4、A10、A100、GTX 20系列和30系列显卡等。如果选择bfloat16,能有效加速处理大模型和批量数据,尤其与混合精度结合使用时性能表现更优。但需确保硬件和软件环境支持该精度。支持 bfloat16的硬件包括 NVIDIA A100 和 H800 GPU,同时需要确保使用 CUDA>=11.2、cuDNN>=8.1.1 等软件环境。更多关于 CUDA Compute Capability 和精度支持情况请参考 NVIDIA 文档:GPU 硬件与支持精度对照表。
除此之外,也可通过以下代码快速调用模型并进行推理
from paddlenlp.transformers import AutoModelForCausalLM
from paddlenlp.transformers import AutoTokenizer
from paddlenlp.generation import GenerationConfig
from paddlenlp.trl import llm_utils
model_id = "paddlenlp/PP-UIE-0.5B"
model = AutoModelForCausalLM.from_pretrained(model_id, use_flash_attention=False)
model.eval()
tokenizer = AutoTokenizer.from_pretrained(model_id, padding_side="left")
generation_config = GenerationConfig.from_pretrained(model_id)
template = """
你是一个阅读理解专家,请提取所给句子与问题,提取实体。请注意,如果存在实体,则一定在原句中逐字出现,请输出对应实体的原文,不要进行额外修改;如果无法提取,请输出“无相应实体”。
**句子开始**
{sentence}
**句子结束**
**问题开始**
{prompt}
**问题结束**
**回答开始**
"""
sentences = [
"2月12日,哈尔滨亚冬会花样滑冰女子个人滑短节目比赛中,中国选手朱易第一个登场且表现出色,拿到62.90分,创职业生涯短节目最高分。",
"2月12日,在哈尔滨亚冬会越野滑雪男子4×7.5公里接力决赛中,由李明林、次仁占堆、宝林、王强组成的中国队夺得金牌。",
"2月13日,在哈尔滨亚冬会冬季两项女子4×6公里接力比赛中,由唐佳琳、文颖、褚源蒙和孟繁棋组成的中国队夺得金牌。",
"中国地震台网正式测定:5月16日06时08分在云南临沧市凤庆县(北纬24.34度,东经99.98度)发生3.5级地震,震源深度10千米。",
"《告别了》是孙耀威在专辑爱的故事里面的歌曲。",
]
prompts = [
"时间, 选手, 赛事名称",
"时间, 选手, 赛事名称",
"时间, 选手, 赛事名称",
"地震强度, 时间, 震中位置, 震源深度",
"歌曲名称, 歌手, 所属专辑",
]
inputs = [template.format(sentence=sentence, prompt=prompt) for sentence, prompt in zip(sentences, prompts)]
inputs = [tokenizer.apply_chat_template(sentence, tokenize=False) for sentence in inputs]
input_features = tokenizer(
inputs,
max_length=512,
return_position_ids=False,
truncation=True,
truncation_side="left",
padding=True,
return_tensors="pd",
add_special_tokens=False,
)
outputs = model.generate(
**input_features,
max_new_tokens=200,
bos_token_id=tokenizer.bos_token_id,
eos_token_id=llm_utils.get_eos_token_id(tokenizer, generation_config),
pad_token_id=tokenizer.pad_token_id,
decode_strategy="greedy_search",
temperature=1.0,
top_k=1,
top_p=1.0,
repetition_penalty=1.0,
)
def get_clean_entity(text):
ind1 = text.find("\n **回答结束**\n\n")
if ind1 != -1:
pred = text[:ind1]
else:
pred = text
return pred
results = tokenizer.batch_decode(outputs[0], skip_special_tokens=True, clean_up_tokenization_spaces=False)
results = [get_clean_entity(result) for result in results]
for sentence, prompt, result in zip(sentences, prompts, results):
print("-" * 50)
print(f"Sentence: {sentence}")
print(f"Prompt: {prompt}")
print(f"Result: {result}")
3. 训练定制#
对于简单的抽取目标可以直接使用 paddlenlp.Taskflow实现零样本(zero-shot)抽取,对于细分场景我们推荐使用轻定制功能(标注少量数据进行模型微调)以进一步提升效果。下面通过报销工单信息抽取的例子展示如何通过几十条训练数据进行 PP-UIE 模型微调。
3.1 代码结构#
.
├── utils.py # 数据处理工具
├── doccano.py # 数据标注脚本
├── doccano.md # 数据标注文档
└── README.md
3.2 数据标注#
我们推荐使用数据标注平台doccano 进行数据标注,本示例也打通了从标注到训练的通道,即 doccano 导出数据后可通过doccano.py脚本轻松将数据转换为输入模型时需要的形式,实现无缝衔接。标注方法的详细介绍请参考doccano 数据标注指南。
原始数据示例:
深大到双龙28块钱4月24号交通费
抽取的目标(schema)为:
schema = ['出发地', '目的地', '费用', '时间']
标注步骤如下:
在 doccano 平台上,创建一个类型为序列标注的标注项目。
定义实体标签类别,上例中需要定义的实体标签有出发地、目的地、费用和时间。
使用以上定义的标签开始标注数据,下面展示了一个 doccano 标注示例:
标注完成后,在 doccano 平台上导出文件,并将其重命名为doccano_ext.json后,放入./data目录下。
这里我们提供预先标注好的文件doccano_ext.json,可直接下载并放入./data目录。执行以下脚本进行数据转换,执行后会在./data目录下生成训练/验证/测试集文件。
python doccano.py \
--doccano_file ./data/doccano_ext.json \
--save_dir ./data \
--splits 0.8 0.1 0.1 \
--schema_lang ch
可配置参数说明:
doccano_file: 从 doccano 导出的数据标注文件。
save_dir: 训练数据的保存目录,默认存储在data目录下。
negative_ratio: 最大负例比例,该参数只对抽取类型任务有效,适当构造负例可提升模型效果。负例数量和实际的标签数量有关,最大负例数量 = negative_ratio * 正例数量。
splits: 划分数据集时训练集、验证集所占的比例。默认为[0.8, 0.1, 0.1]表示按照8:1:1的比例将数据划分为训练集、验证集和测试集。
task_type: 选择任务类型,目前只有信息抽取ie这一种任务。
is_shuffle: 是否对数据集进行随机打散,默认为 False。
seed: 随机种子,默认为1000.
schema_lang: 选择 schema 的语言,可选有ch和en。默认为ch,英文数据集请选择en。
备注:
默认情况下 doccano.py 脚本会按照比例将数据划分为 train/dev/test 数据集
每次执行 doccano.py 脚本,将会覆盖已有的同名数据文件
在模型训练阶段我们推荐构造一些负例以提升模型效果,在数据转换阶段我们内置了这一功能。可通过negative_ratio控制自动构造的负样本比例;负样本数量 = negative_ratio * 正样本数量。
对于从 doccano 导出的文件,默认文件中的每条数据都是经过人工正确标注的。
3.3 模型微调#
推荐使用 大模型精调 对模型进行微调。只需输入模型、数据集等就可以高效快速地进行微调和模型压缩等任务,可以一键启动多卡训练、混合精度训练、梯度累积、断点重启、日志显示等功能,并且针对训练过程的通用训练配置做了封装,比如:优化器、学习率调度等。
使用下面的命令,使用 paddlenlp/PP-UIE-0.5B 作为预训练模型进行模型微调,将微调后的模型保存至指定路径中。
如果在 GPU 环境中使用,可以指定 gpus 参数进行多卡训练:
# 返回 PaddleNLP/llm 目录
python -u -m paddle.distributed.launch --gpus "0,1" run_finetune.py ./config/qwen/sft_argument.json
sft_argument.json 的参考配置如下:
{
"model_name_or_path": "paddlenlp/PP-UIE-0.5B",
"dataset_name_or_path": "./application/information_extraction/data",
"output_dir": "./checkpoints/ie_ckpts",
"per_device_train_batch_size": 1,
"gradient_accumulation_steps": 1,
"per_device_eval_batch_size": 1,
"eval_accumulation_steps":8,
"num_train_epochs": 3,
"learning_rate": 3e-05,
"warmup_steps": 30,
"logging_steps": 1,
"evaluation_strategy": "epoch",
"save_strategy": "epoch",
"src_length": 1024,
"max_length": 2048,
"fp16": true,
"fp16_opt_level": "O2",
"do_train": true,
"do_eval": true,
"disable_tqdm": true,
"load_best_model_at_end": true,
"eval_with_do_generation": false,
"metric_for_best_model": "accuracy",
"recompute": false,
"save_total_limit": 1,
"tensor_parallel_degree": 1,
"pipeline_parallel_degree": 1,
"sharding": "stage2",
"zero_padding": false,
"unified_checkpoint": true,
"use_flash_attention": false
}
更多 sft_argument.json 配置文件说明,请参考大模型精调
3.4 定制模型一键预测#
使用 PaddleNLP 的高性能 predictor 进行快速推理
内置全环节融合算子策略
支持 Weight Only INT8及 INT4推理,支持权重、激活、Cache KV 进行 INT8、FP8量化的推理
支持动态图推理和静态图推理两种方式
在推理之前,推荐编译安装 PaddleNLP 大模型高性能自定义推理算子。使用这些高性能算子,可以大幅提升大模型推理速度。详细的安装教程请参考大模型高性能推理算子安装教程
安装完之后,可按照下列指令,进行高性能推理。
# PaddleNLP/llm目录下
python predict/predictor.py \
--model_name_or_path ./checkpoints/ie_ckpts \
--dtype float16 \
--data_file ./application/information_extraction/data/test.json \
--output_file ./output.json \
--src_length 512 \
--max_length 1024 \
--batch_size 4 \
--inference_model 1 \
--quant_type weight_only_int8
可配置参数说明:
model_name_or_path: 必需,预训练模型名称或者本地的模型路径,用于热启模型和分词器,默认为 None。
src_length: 模型输入上下文最大 token 长度,默认为1024。
max_length: 模型输入(上下文+生成内容)的最大 token 长度, 默认为2048。
inference_model: 是否使用 Inference Model 推理,默认值为 False。Inference Model 内置动态插入和全环节算子融合策略,开启后性能更优。如果没有编译安装 PaddleNLP 大模型高性能自定义推理算子,只能设置为False
quant_type: 是否使用量化推理,默认值为 None。可选的数值有weight_only_int8、weight_only_int4、a8w8和a8w8_fp8。如果没有编译安装 PaddleNLP 大模型高性能自定义推理算子,只能设置为None
更多关于 predictor.py 的配置参数说明,请参考大模型推理教程
3.5 实验指标#
我们在通用测试集和医疗、新闻、对话与金融等垂类测试集上进行了实验:
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019Avg
数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域
PP-UIE-0.5BF1(0-shot)0.4790.6380.5930.7730.7230.3610.7820.621
PP-UIE-1.5BF1(0-shot)0.4850.6880.610.7990.7680.4440.8030.657
F1(5-shot)0.520.6940.6250.8120.8120.4660.8010.676
PP-UIE-7BF1(0-shot)0.5210.6960.6150.8260.8070.4340.8120.673
F1(5-shot)0.5270.7050.6260.8260.8610.4830.8010.69
PP-UIE-14BF1(0-shot)0.5560.7120.6370.8410.8430.4880.8320.701
F1(5-shot)0.5880.7290.670.8370.8650.5760.8320.728
0-shot 表示无训练数据直接通过模型进行预测,5-shot 表示预测时使用五个数据样例作为提示。实验表明 PP-UIE 在垂类场景可以通过少量数据(few-shot)进一步提升效果。
同时,我们测试了PP-UI系列模型在不同数据集,分别在纯动态图、开启融合算子(infernce_model = True)和win8(开启Int8量化)在batch size为[1,2,4,8,16,32,64]时的运行速度(Tokens Per Second)和预测精度(F1)。
PP-UIE-0.5B
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019batch size数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域PP-UIE-0.5B动态图1F10.5080.6230.5930.7840.7230.3320.787TPS30.26930.51530.40330.90129.92230.82330.6622F10.5040.6170.5910.780.7210.3370.785TPS56.90656.69657.72656.20558.57656.47257.6744F1 0.4940.6090.5910.7740.7210.3350.784TPS109.094109.307107.597106.739106.243107.37108.958F1 0.4820.6070.5870.7650.7120.3330.784TPS199.777199.373199.513201.492200.301197.366198.62816F1 0.4610.5940.5880.750.7180.3320.771TPS342.747338.052333.88339.824325.661319.512339.59932F1 0.4250.5840.5870.7250.7140.330.751TPS500.259495.871478.906508.637483.591480.621504.75864F1 0.360.5640.5850.6850.7130.3170.738TPS714.742701.403661.534705.949668.907671.853718.122 fuse_mt1F10.4970.6180.5850.780.720.3260.784TPS88.02471.53478.17863.19551.8748.63156.0482F10.4950.6170.5910.7810.7210.3270.78TPS188.091157.388140.698146.544111.774102.06133.2364F1 0.4950.6090.5940.7810.7150.3320.784TPS395.09318.009294.731298.858220.825207.682304.2368F1 0.4970.6190.5920.780.7190.3210.787TPS784.377695.807587.066612.309456.107428.209538.05316F1 0.4930.6250.5850.7750.7240.3190.789TPS1456.8241260.5931092.2221189.585895.154822.0571134.44132F1 0.4950.6210.5910.7780.7210.3210.788TPS2619.0442241.1121957.3072130.9251668.4881533.0732311.61364F1 0.4960.6130.5870.7810.7190.3220.788TPS4279.3353571.3272775.0133692.862709.2382724.13918.789WINT81F1 0.50.6190.5890.7740.710.3330.787TPS102.62682.01665.70167.22653.32853.32757.8672F1 0.5020.6130.5850.7790.720.3310.789TPS199.294169.8142.026147.443111.743102.999121.7124F1 0.4990.6280.5910.7770.7140.3270.788TPS390.208340.839299.54299.343256.566268.026258.9888F1 0.5020.6220.5880.7790.7120.3230.784TPS821.311713.367597.427656.373439.528466.009532.47316F1 0.4990.6210.5870.7790.720.3270.784TPS1547.1891335.0121194.9041289.993875.995936.5251052.36132F1 0.5010.6190.5930.7810.7210.3180.788TPS2981.0432176.5712193.8282260.4121517.5171516.6531937.82764F1 0.4990.623 0.5890.7780.7220.3390.785TPS5288.7223643.2282646.1073674.8142748.3162478.6763510.926PP-UIE-1.5B
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019batch size数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域PP-UIE-1.5B动态图1F10.520.6950.6260.8180.7660.4560.8TPS26.4726.14125.44925.61225.3726.08425.9992F10.5090.690.6260.8140.7640.460.799TPS48.54548.547.85147.63947.62746.60248.1964F1 0.4920.6890.6240.810.7650.4560.795TPS91.65391.68491.3491.4891.15689.75290.9678F1 0.4680.6760.6260.80.7630.4580.791TPS169.458169.043165.25170.523169.804164.427171.73916F1 0.4280.6640.6260.7850.7630.4560.78TPS296.315292.382290.317295.588281.144281.313295.66132F1 0.3790.6320.6250.7550.7630.4520.758TPS481.643476.989458.55477.239464.775451.335487.22864F1 0.3280.5760.6250.7070.7610.4510.72TPS689.837682.329606.592663.469645.239636.379660.386 fuse_mt1F10.5090.6810.6210.8130.7650.4540.798TPS83.86568.81978.82861.90555.43256.59657.1382F10.5110.6860.6250.8110.7680.4390.799TPS182.739150.276131.843150.973107.68199.068138.1054F1 0.5090.6860.6180.8110.7690.4480.799TPS389.224316.024274.555276.531236.939204.266300.5878F1 0.5090.6820.6190.8120.7620.450.798TPS751.196627.038554.42583.324435.373412.652618.79616F1 0.5040.6830.6180.8150.7630.4430.798TPS1367.6161139.2041023.1041079.171859.398789.851224.73932F1 0.510.6870.6150.8120.7630.4480.8TPS2346.1831862.6371721.6261873.0011446.1561358.7692174.64864F1 0.5050.6860.6120.8110.7640.450.799TPS3435.4182807.3752642.1862862.7732201.762086.9643377.49WINT81F1 0.5160.6850.630.810.7760.4510.795TPS74.78268.26358.32364.34550.21347.89448.8722F1 0.5150.6890.6260.8090.7650.440.793TPS197.449151.655139.386140.525116.93197.83131.5074F1 0.5150.6920.6220.8090.7690.4430.797TPS356.658291.106267.558272.57207.656198.878251.9768F1 0.5150.6840.6230.8120.7620.4420.798TPS709.983575.773522.708543.154431.868429.064518.81116F1 0.5150.6820.6180.8140.7720.4530.799TPS1318.791031.525935.156983.182765.36714.7851065.39932F1 0.5150.690.6290.8110.7620.4480.798TPS2366.7511744.83315431757.0311264.1791177.2451816.41564F1 0.5150.6810.6220.8110.7640.4440.797TPS3799.3262567.6482265.592650.2711906.5241761.0323083.406PP-UIE-7B
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019batch size数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域PP-UIE-7B动态图1F10.5280.7030.6150.8270.7860.4310.813TPS24.97124.26324.93524.20124.4324.5924.5792F10.5240.7020.6150.8270.7860.4330.812TPS47.83346.96847.38848.06647.847.52148.0334F1 0.5190.7040.6160.8270.7840.4330.813TPS88.6987.36487.51688.94189.23190.04590.1968F1 0.5140.7040.6150.8260.7850.4330.813TPS169.087161.141162.046164.154164.776153.411161.85316F1 0.5010.7030.6140.8260.7850.4320.813TPS288.043268.144264.288270.323260.654252.396270.88432F1 0.4790.7030.6150.8230.7840.4320.12TPS439.281400.6385.3381406.698379.117366.518399.54664F1 0.4410.7020.6140.8160.7830.4320.808TPS613.321593.829515.7574.011504.845506.382556.177 fuse_mt1F10.5170.7020.6230.8230.7880.4230.811TPS51.7447.89541.02143.36937.0837.43741.6612F10.5160.6990.6130.820.7880.4270.812TPS105.84397.71884.91589.26674.25266.24980.9744F1 0.5140.6960.6090.8230.7830.4340.808TPS216.985189.58180.078187.1146.36131.028172.9638F1 0.5180.7010.6180.8210.7870.4280.809TPS391.686355.544334.309349.757291.318249.223348.77116F1 0.5150.6950.6110.8230.7880.4260.809TPS736.629642.235568.576628.74489.87458.587610.34532F1 0.5140.7010.6090.8260.7820.4230.812TPS1230.5911050.501927.8911001.303781.299734.3241055.44264F1 0.5170.6970.6130.8230.7880.4240.81TPS1819.1051579.2281336.4261514.9311161.1611121.5591594.559WINT81F1 0.5350.6990.6230.8240.7820.4440.812TPS65.29846.81940.87343.8335.28132.28735.7052F1 0.5220.70.610.8240.780.4180.812TPS127.68990.92978.17485.99967.12459.17582.494F1 0.5250.6950.6140.8260.7790.4250.81TPS234.016193.467165.158179.821141.483129.085158.4118F1 0.5220.6960.6180.8240.7810.4310.811TPS497.447372.414319.802334.657274.958236.714341.58716F1 0.5220.7030.6130.8240.7760.4290.812TPS897.135695.732604.092635.239478.883423.663596.28932F1 0.5220.7030.6150.8270.7840.4270.812TPS1468.6471049.653890.9381017.609816.842708.418992.63364F1 0.5260.7020.620.8220.7860.4230.809TPS2152.0351432.9491237.6721477.6371066.383954.0651503.071PP-UIE-14B
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019batch size数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域PP-UIE-14B动态图1F10.5320.7150.6370.8440.8260.490.828TPS14.68514.83714.75114.69814.32914.21214.2612F10.530.7130.6370.8430.8270.4890.828TPS29.06229.14628.73429.24529.5629.20528.9724F1 0.5260.7110.6370.8430.8260.4880.829TPS55.02554.93854.63354.53255.62653.93454.9698F1 0.520.7080.6360.8420.8270.4890.828TPS102.47899.56899.376100.461100.83195.6498.41816F1 0.510.7060.6350.8410.8250.4890.827TPS185.198171.829170.281174.586164.299152.416178.83432F1 0.490.7110.6340.8360.8220.4890.827TPS309.815268.985267.216285.568253.737227.749293.79464F1 0.4490.7120.6330.8320.8220.4880.826TPS459.762428.323376.201427.951343.526355.367459.668 fuse_mt1F10.5230.7060.6370.8390.8220.4840.829TPS34.49431.34729.99630.97728.47825.84629.0522F10.5190.7080.6310.840.8270.480.826TPS67.86962.08861.32160.01754.29150.91157.0194F1 0.5220.7010.6380.840.8230.4760.826TPS131.164122.297112.31115.559103.08896.69110.6868F1 0.520.7080.630.8420.8250.4780.827TPS245.615229.256215.212220.401196.891175.141210.52616F1 0.5180.7140.6340.8420.820.4770.827TPS440.587399.806368.995375.22329.55303.739364.359WINT81F1 0.5240.7120.6340.8420.8250.4770.827TPS41.23438.76234.77735.23334.72830.87132.1292F1 0.5250.7060.6330.8420.820.4780.826TPS80.32373.72263.89364.98887.72858.28967.8264F1 0.5240.7080.6370.8440.8240.4780.826TPS162.169141.365127.283130.367120.714112.827132.5258F1 0.5250.7010.630.8420.8180.4770.826TPS332.437281.661238.875266.18209.635175.688267.37316F1 0.5240.7120.6340.8430.8210.4870.828TPS545.886472.752391.256424.774353.743288.442420.25632F1 0.5240.7070.6350.8410.8190.4780.823TPS787.417640.262545.588602.611460.068424.596607.83264F1 0.5260.7070.6370.8390.8310.4810.827TPS1261.826941.326794.079894.79658.474639.901924.28以上实验均在单卡A100 80G运行