杭州君同未来科技申请基于场景嵌套的大语言模型安全漏洞自动检测专利,能够有效地揭示和检测大语言模型存在的内生和外生安全漏洞
金融界2025年5月1日消息,国家知识产权局信息显示,杭州君同未来科技有限责任公司申请一项名为“基于场景嵌套的大语言模型安全漏洞自动检测方法和装置”的专利,公开号CN119885206A,申请日期为2025年1月。
专利摘要显示,本发明公开了一种基于场景嵌套的大语言模型安全漏洞自动检测方法和装置,属于大语言模型安全技术领域,方法包括:构建针对原始提示词的输入变换方式并构建相应的解码方式嵌入目标大语言模型的输入中;在目标大语言模型中进行任务场景嵌套,将原始提示词分别经过不同的输入变换后分别输入目标大语言模型,根据嵌入的解码方式对变换后的提示词进行解码并进行模型推理生成相应任务场景下的输出结果;利用判别器模型对目标大语言模型的输出结果进行有害性判断,若判断结果为有害则表示目标大语言模型存在安全漏洞。本发明能够有效地揭示和检测大语言模型存在的内生和外生安全漏洞,实现对大语言模型存在的安全漏洞进行高效、全面的检测。
天眼查资料显示,杭州君同未来科技有限责任公司,成立于2024年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本332.8125万人民币。通过天眼查大数据分析,杭州君同未来科技有限责任公司共对外投资了1家企业,参与招投标项目1次,专利信息5条。
本文源自:金融界
作者:情报员