继作家、画家、程序员担忧被 AI 取代后,微软近日最新推出的一个新的 AI 模型,可能会让会计师和数据分析师也开始感到紧张了。
在论文中,研究人员首先强调了电子表格在商业世界中的普遍性和重要性,指出电子表格被广泛用于各种任务,从简单的数据录入和分析,到复杂的财务建模和决策。然而,由于“广泛的二维网格、各种布局和多种格式选项”,导致现有的大型语言模型(LLM)很难理解电子表格的内容并对其进行推理。
为此,微软推出了 SpreadsheetLLM,想要“开创一种高效的编码方法,以此释放和优化 LLM 在电子表格上强大的理解和推理能力”。
最初,微软研究团队采用了一种原始的序列化方法,整合了单元格的地址、值以及格式信息。但是这种方法受限于 LLMs 的 token 限制,对大多数应用来说并不实用。为了解决这一难题,微软开发了一种创新的编码框架 SheetCompressor,它能够有效压缩电子表格,使其更加适配 LLM 的处理需求。
从框架图中可以看出,SheetCompressor 框架由三个核心模块组成:
基于结构锚点的压缩:在整个电子表格中放置“结构锚点”,帮助 LLM 理解数据结构。
微软表示,在电子表格检测任务中,SheetCompressor 大幅提升了处理速度和准确率:相较于原始的序列化方法,在 GPT-4 的上下文学习环境下,性能提升了 25.6%。此外,经过 SheetCompressor 微调的 LLM,即使平均压缩比例高达 25 倍,但 F1 得分(一种衡量二分类模型精确度的指标)仍能达到业界领先的 78.9%,超越同类模型 12.3%。更值得一提的是,在对各种 LLM 进行“全面评估”后,微软发现 SheetCompressor 可将电子表格编码的 token 使用量大幅减少 96%。
不过,微软也承认目前 SpreadsheetLLM 模型仍有一些限制,如无法很好理解复杂或结构化程度较高的数据,以及不能压缩包含自然语言的单元格等。
但总体来说,展望未来 SpreadsheetLLM 能让更多用户更容易访问和理解电子表格数据,还能帮助自动化许多与电子表格数据分析相关的繁琐耗时的任务,如数据清理、格式化和汇总。借助 AI 加持下的 SpreadsheetLLM,未来企业有望节省许多时间和资源,让员工专注于需要人类判断力和创造力的高价值活动。
扫码回复“抽奖”即有机会获得时尚 T 恤、精选图书和大会精品 PPT 等好礼~
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
枪击特朗普的20岁少年曾是数理高材生,在养老院当护工,在校期间竟是被霸凌者…
印度首富儿子婚礼耗资23亿,英国前首相带娃参加,但抢镜的依然是金·卡戴珊啊……
7月16日,河南郑州(发布)要想孩子长,肠胃先跟上。找准三个穴位对应孩子脾 胃 肠,扶阳又助长。三伏...
数字化赋能小升初英语衔接教学——中国教师报课改中国行(英语)公益教研会圆满闭幕
与中坚力量共成长,2024建信信托艺术大奖评委会特别奖获奖艺术家凌海鹏