• 隐私政策
  • 联系我们
  • 关于我们
2026 年 5 月 9 日 星期六
聚赢方舟
广告
  • 首页
  • 快讯 7x24
  • 行业新闻
  • 商业动态
  • 股市风云
  • 期货研报
  • 基金财讯
  • 贵金属
No Result
View All Result
  • 首页
  • 快讯 7x24
  • 行业新闻
  • 商业动态
  • 股市风云
  • 期货研报
  • 基金财讯
  • 贵金属
No Result
View All Result
聚赢方舟
No Result
View All Result
Home 贵金属

奇富科技发布首个信贷多模态评测基准,可全面评估信贷 AI 模型实战能力

by 聚赢方舟
4 月 ago
in 贵金属
Reading Time: 1 min read
A A
分享至微博分享给朋友

【TechWeb】1 月 8 日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准 FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷 AI 的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建 AI 基础设施提供关键支撑。

据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷 AI 模型的实战能力。

与传统侧重单一识别或理解能力的评测不同,FCMBench 所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动 AI 更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域 AI 模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从 「单点优化」 迈向 「产学研协同创新」。

奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在 FCMBench 上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

FCMBench-V1.0 构建了与真实银行审核流程高度一致的评测框架,涵盖 18 类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含 4043 张合规图像和 8446 个测试样本,问题覆盖信贷审核全链条。

其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

通过对 23 个主流多模态模型 (来自 14 家顶尖 AI 企业及科研机构) 的全面评测,FCMBench 展现出强大的鉴别能力。结果显示, Google DeepMind 的 Gemini 3 Pro(64.61) 位列商业模型榜首,阿里巴巴 Qwen3-VL-235B(57.27) 成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型 Qfin-VL-Instruct 以 64.92 的 F1 分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。

目前,FCMBench 的数据集、评测工具以及 Qfin-VL-Instruct 的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融 AI 技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

技术报告链接:https://arxiv.org/abs/2601.00150

ADVERTISEMENT

【TechWeb】1 月 8 日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准 FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷 AI 的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建 AI 基础设施提供关键支撑。

据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷 AI 模型的实战能力。

与传统侧重单一识别或理解能力的评测不同,FCMBench 所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动 AI 更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域 AI 模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从 「单点优化」 迈向 「产学研协同创新」。

奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在 FCMBench 上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

FCMBench-V1.0 构建了与真实银行审核流程高度一致的评测框架,涵盖 18 类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含 4043 张合规图像和 8446 个测试样本,问题覆盖信贷审核全链条。

其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

通过对 23 个主流多模态模型 (来自 14 家顶尖 AI 企业及科研机构) 的全面评测,FCMBench 展现出强大的鉴别能力。结果显示, Google DeepMind 的 Gemini 3 Pro(64.61) 位列商业模型榜首,阿里巴巴 Qwen3-VL-235B(57.27) 成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型 Qfin-VL-Instruct 以 64.92 的 F1 分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。

目前,FCMBench 的数据集、评测工具以及 Qfin-VL-Instruct 的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融 AI 技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

技术报告链接:https://arxiv.org/abs/2601.00150

聚赢方舟

专业财经网站

聚赢方舟 (arkxx.com) 网站是长沙聚赢方舟文化传媒有限公司旗下运营的财经资讯门户网站。聚赢方舟致力于为用户提供全面而深入的财经资讯与金融数据分析。网站汇集了最新的市场行情、股票动态、投资策略以及经济趋势,为投资者和财经行业人士提供及时的新闻参考。网站通过高效的数据处理与分析工具,聚赢方舟帮助用户把握市场机会,优化投资决策。

此外,网站还定期发布专业的市场评估报告和财经评论,确保用户能够获得最准确的市场洞察。

方舟日历

2026 年 5 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 4 月    

标签

中国 中国企业 也不 买了 互联网 假日 养老金 北大 千元 印度 反超 奶茶 家族 工龄 怎么回事 或将 房价 房贷 新能源 新闻 日本 更大 有什么 村官 来了 楼市 江苏 沙特 浙江 特斯拉 电动车 石油 美元 美国 美籍 节日 芯片 让人 越南 长假 防晒 阿里 阿里巴巴 院士 首富

© 2025 长沙聚赢方舟文化传媒有限公司 by 聚赢方舟 - 湘 ICP 备 2025135270 号-1

No Result
View All Result
  • Home

© 2025 长沙聚赢方舟文化传媒有限公司 by 聚赢方舟 - 湘 ICP 备 2025135270 号-1

此网站使用 cookie。继续使用本网站即表示您同意使用 cookie。访问隐私和 cookie 策略.。