llm as human computer interface

感觉llm基本上解决了一个计算机之前很弱的问题

就是处理非结构化的数据，比如文本，图片，视频，音频之类

之前的各种ai solution都很弱，也很vertical，都是定制化而且只有专门的公司才可以做

但是现在多模态大模型一下子把解题质量提升了很多，跟人的差距越来越小，甚至是超过人类了

比如从文本里提取信息，就是把非结构化数据转换成结构化数据

以前我在国内读研究生时就做information extraction，各种模式匹配，但是非常fragile，写各种规则

现在一个模型加一个简单的prompt就搞定了，还很generalize

语音，图片，视频都可以

所以human computer interaction这中间的鸿沟给bridge起来了

这件事情很重要，很伟大

人类大多数的智慧结晶都在这些unstructure的data里

有了结构化数据，就可以调用各种程序各种软件来实现一些特定的功能