大家好,我是许可,数据治理专家,专注数据治理20年,数据治理实战派。分享数据治理解决方案与数据治理实践经验,以后大家多多交流。
这是我的第47篇原创,还是关于的,此前一个多月的时间,我也算是亲自下场把玩了一番,在这个过程中一直在思考软件企业应该让为我们所用,今天就来聊聊这个吧。
我本来想聊聊其他的话题,但是最近太多老朋友来找我聊AIGC的合作,也是没得办法,现在可谓是言必谈、AIGC,躲都躲不开。
老规矩,先来看一下现在市场环境。
作为现象级产品横空出世之后,极大地带动了大语言模型产业和生成式AI(AIGC)产业的蓬勃发展。海外市场上,、微软、谷歌、Meta等巨头动作频频。中国市场更是风起云涌,百度、阿里、华为、腾讯、360、商汤、京东、科大讯飞、字节跳动、昆仑万维等巨头厂商结合自身业务及战略布局,陆续宣布研发或已发布大语言模型产品。
众多科技大佬也宣布进军大模型领域进行创业,除了此前高调入局的美团联合创始人王慧文,搜狗创始人王小川也官宣要在大模型领域创业,新公司已获得5000万美元启动资金。
可以说,通用人工智能时代正在缓缓开启……
除了这些头部公司和科技大佬,国内不少垂直赛道及大模型解决方案厂商,也想趁着这次机会锚定一个或多个行业领域,意图打造“数据飞轮”护城河;像我们光点科技这样的应用层厂商则是在结合客户需求,积极试水整合大模型能力,提升产品功能。希望能够抓住行业发展的机会,分得一杯羹。
随着火爆出圈,各行业都在加速利用AI技术在垂直领域抢先落地应用,但在高速发展的同时,其中暗藏的风险也在逐渐暴露。
4月10日,中国支付清算协会发布了《关于支付行业从业人员谨慎使用等工具的倡议》,向支付行业提出了三点倡议: 其一,依法依规使用。支付行业从业人员要遵守所在地区的网络使用规定,正确认识等工具的机遇和风险,全面评估使用等工具处理工作内容的风险,依法合规使用等工具。 其二,不上传关键敏感信息。支付行业从业人员在使用等工具时,要严格遵守国家及行业相关法律法规要求,不上传国家及金融行业涉密文件及数据、本公司非公开的材料及数据、客户资料、支付清算基础设施或系统的核心代码等。 其三,会员单位加强内部管理和引导。会员单位要进一步健全信息安全内控管理制度,开展有针对性的数据风险防控工作,加强宣传和引导,提升员工的风险防范和数据保护意识,切实维护国家金融及支付清算行业安全。
我们光点这样的公司能在AIGC时代做些什么呢?
毫无疑问,目前生成式大模型做的最好就是,技术至少领先国内3年时间(王小川说的),他们推出的已经被广泛应用在各个行业。国内很多公司都想借助,做点什么。
我也一直在想这个问题,但在思考这个问题的时候,我也有了一点思考。
一、我们能看到的机会,能想到的应用场景和用例,利润和发展空间都太小了
一说能做什么,大家首先想到的就是知识库、智能客服机器人,但这样的产品或服务,其实哪家公司都能做,接一个的 Fine API,稍微开发一下结局到客户的系统就行了。
逻辑也并不复杂,利用已经开放的Fine API,将自有的 Base,比如产品文档、常见问答、客服历史对话上传到,建立私有模型。这样,任何的用户都可以拥有属于自己的Chat Bot,它不仅能够进行常规的对话,还能够利用企业自有,甚至非公开的训练数据来提供针对性很强的服务。
而在这个过程中,并不产生什么新的价值,只是做了把的API与用户数据的结合的动作,最多再开发一个内容集成的交互界面,利润太薄了,而且小公司也很难把这个业务做大。
二、那我们能做些什么?机会又在哪里呢?
1、帮助客户利用的能力,去管理积累的数据,挖掘数据的价值
说起来简单,实施起来确实很难的。首先是数据的问题要解决,这个是一切的基础。
1)数据分布在不同的系统,甚至很多还没有数字化、信息化;
2)数据本身的质量问题,是否具备验证修整机制
3)数据以不同的媒体格式存在,文字、图片、视频,还有更重要的结构化表格;
4)不同性质的数据如何转换为正确的微调格式?
5)如何标识复杂的数据访问权限、修改权限?
6)如何在AI提供自然语言问答的时候,准确地过滤权限,并进行准确的操作?
7)输入输出数据的格式,过程数据的存取机制
这个处理数据的过程其实跟以往的数字化转型很像,只不过这次是要利用AI工具,又向前迈了一步,这一步能不能迈出去,最终还是取决于前一步走的是否扎实。
那我们的机会,可能还是在于为客户数据接入这类的AI服务之前,要干的那些脏活累活上。
当然我们也不能囫囵吞枣,照单全收,什么数据都搞一遍。
而是在帮助客户管理的业务数据和流程中要多总结提炼经验,这才是最有商业价值的:比如,找到有哪些是值得转换为训练数据并用来微调的,有哪些转换工作需要在微调之前去做。
2、如果你有自己独有的沉淀的行业数据,可以用来强化训练自己的私有模型
说来也简单,这其实就是强者恒强的故事。如果你有独有的沉淀的行业数据,即使没有用来强化训练自己的私有模型,照样可以赚钱。
但如果你把自己沉淀多年的数据用于投喂AI,强化训练出一个自己的私有模型,商业变现会变得更简单,客户只需要一个API就可以快速接入,一次开发长期受用。但前提还是这个模型要足够好用,要能完美解决客户的某个具体需求。
三、大处着眼,微处入手,脚踏实地一步步来,一口吃不成个胖子
的走红,让我们看到的AI的强大,也让我们对AIG的到来充满期待,但我要说的是AI不能解决所有问题,就像不能帮你搭建一个数据中台产品一样,它不可能给你提供一套完整的代码。
现在的我们,还是要从大处着眼,微处入手。一个问题一个问题去解决,一点一点去迭代进步。
现在的AI已经可以帮我们很好地处理文字、图片,音频、视频相信也不会太远了!现在的AI可以帮我们处理一些简单的问题,以后帮我们处理更多更复杂的问题也都是有可能的。
我很期待这一时刻的到来。
关于光点科技
光点科技是一家在政企数据治理、数据中台建设、数据可视化展示分析方面有着丰富经验的公司。光点科技既提供数据产品,也提供数据服务,服务客户超过100家,在金融、电信、政务、泛零售等行业的数据治理方面有丰富的实施经验和创新的解决方案。
如果有数据治理、数据可视化、AIGC的问题,欢迎找我交流探讨。