llm as human computer interface
感觉llm基本上解决了一个计算机之前很弱的问题
就是处理非结构化的数据,比如文本,图片,视频,音频之类
之前的各种ai solution都很弱,也很vertical,都是定制化而且只有专门的公司才可以做
但是现在多模态大模型一下子把解题质量提升了很多,跟人的差距越来越小,甚至是超过人类了
比如从文本里提取信息,就是把非结构化数据转换成结构化数据
以前我在国内读研究生时就做information extraction,各种模式匹配,但是非常fragile,写各种规则
现在一个模型加一个简单的prompt就搞定了,还很generalize
语音,图片,视频都可以
所以human computer interaction这中间的鸿沟给bridge起来了
这件事情很重要,很伟大
人类大多数的智慧结晶都在这些unstructure的data里
有了结构化数据,就可以调用各种程序各种软件来实现一些特定的功能