人平易近财讯3月19日电,据中国信通院动静,为摸清大模子的现状,鞭策大模子使用走深走实,中国消息通信研究院所基于前期的AI Safety Benchmark测评工做,本轮测试工做将以狂言语模子为测试对象,涵盖了现实性和性两品种型。测试数据包含7000余条中文测试样本,测试形式包罗对应于性检测的消息抽取取学问推理两类题型,以及对应现实性检测的现实判别题型。总体涉及人文科学、天然科学、使用科学和形式科学五种测试维度。