创业笔记:气候行业是大模型创业的最好场景之一

AI快讯2年前 (2023)发布 wangzhan
2,003 0
ChatGPT国内版
2020年,中国的“3060”碳达峰与碳中和目标几乎在一夜之间催生了“碳中和”行业。接下来的两年,众多创业公司和投资者纷纷涌入市场,擦边的外行也一边质疑一边挤入“碳中和赛道”。从2020年至2022年,我作为创始成员做了一个碳盘查软件,与国内知名的碳核查机构和碳交易所接触,花了几个月和海内外的项目开发方、Broker ( 中间商) 沟通交流。最大的感悟是,这是一个充满信息不对称的“信息差盈利 information gap as a business ”行业,距离“产品带动增长”是很遥远的。信息差产生了咨询需求,进而又产生赚取大部分利润的信息搬运工。从2020年到2022年底,市场上琳琅满目的双碳产品和服务背后,是行业内外人士的焦虑传播,但似乎没有太多真正致力于气候适应和减缓的举措被实施。

创业笔记:气候行业是大模型创业的最好场景之一
气候变化反映在市场的本质问题是什么?
经济学家的解释是,环境带来的问题是有负外部性的(社会成本),需要内部化。
在行业层面来解释,气候导致的问题与需求不匹配,产品的用户与付费者利益不一致,最后变成“谁来担责付钱”的问题。
对于个人和企业来说,气候问题是个经济问题。气候带来的影响有时间和距离的隔阂,大部分人既感受不到远方的气候灾害影响,也很难体会未来的气候风险。
我们始终认为气候问题是一个数据问题,数据能加速解决方案。过去一年创业的同时我来帝国理工读书,后来也加入了帝国理工气候金融研究院 CCFI ,成为里面第一个亚洲面孔的研究员。来看一看气候行业“最前沿”的公司和科研都在做什么。最诚实的结论是,climate change is real, the solution has to be based on data.
气候数据是复杂系统的价值数据,环境外部性问题的解决方案在于数据内部化,也就是当所有的外部性能够被数据所反馈时候,外部性就能被内化,所以前几年诺奖颁发给气候变化科学家的意义也在于此,因此真正解决气候问题一定离不开数据。
在解决方案的维度上,现在盛行的LLM无疑与气候一拍即合。可以说,Large Language Models (LLM) 应用场景最好的出路之一在于气候,因为气候本身就是一个多模态数据的集合。
回看这几年双碳行业,不论国内外,对于市场公平透明的呼声成为主流,每一个气候变化的会议都在强调数据的重要性
从价值本质来说,气候数据或者气候问题不仅是一个合规的问题,也是价值创造的问题。现在的气候方案需要真正从风险合规走向价值创造才能形成可持续的商业模式,而这个过程高度依赖于对数据的理解和挖掘。
综合下来,气候问题是一个风险管理与价值创造问题,尤其在金融领域。大模型有别于传统模型,擅长从多模态数据中学习并提取跟特定任务相关的有价值信息,所以大模型实际上可以将复杂的气候风险转化为价值,倒逼金融行业改革。LLM实际上是金融改革的风口,会影响很长的时间。
气候数据:You can manage what can be measured
John Doerr 是气候与量化的重要推动人 (推荐一个他在 TED Countdown 上的演讲, How to decarbonize the grid and electrify everything )2022 年 John 也在他的书《Measure what matters》中直接把气候问题与解决方案量化拆解成了 OKR 的形式。

6 个大的气候目标

食物,电气化我们的交通,电网脱碳、行业脱碳,基于自然的解决方案、政策、行动,创新 ,气候投资

创业笔记:气候行业是大模型创业的最好场景之一
“We have climate goals for a while,
but we don’t have a plan yet
Climate science is becoming the new computer science
—— John Doerr

气候风险是怎么被 Climate Scientist 量化的?

为什么做气候变化的解决方案如此艰难?Richard Feynman 这句话给了哲学层面很好的解释,“人类能想的远远多于能表达的,能表达的远远多于能做的”。在气候变化议题上,压倒性的科学共识是人类活动导致全球变暖,但网络社区传播的信息往往良莠并存,倘若没有合理的动力,那企业和个人能做的就寥寥无几了。因此最好的气候解决方案应该是鼓励减碳的行为,而非只是惩罚破坏环境的行为。

我们能精确预测和计算气候变化的影响吗?气候领域数据的多模态与复杂性导致了地球系统很难在小尺度上预测,即使downscale能做出一定的预测,目前能够和大部分人有关系的可能就是天气预报和一定程度的灾害预警。但各个学科的专家还是试图用更容易理解的方式来描述温室气体带来的影响,用经济层面的例子,经常见到的情景分析( scneario analysis ) 和气候压力测试 (stress testing),评估气候相关风险与经济成果的联系的关键工具,来评估对金融稳定和单个金融机构的影响, 帮助管理和减轻气候变化带来的金融风险。对于量化气候风险,至少目前为止在传统行业小范围基础上能做的是非常有限的。

宏观的层面是能够一定程度描述气候风险的。2013 年开始,英国政府推动了一个气候全球计算器,是世界能源、土地和粮食系统的开源模型,允许用户模拟不同人类活动和场景对温室气体排放和全球气候变化的影响,这是一个很好的开始。政府间气候变化专业委员会(IPCC)的报告是业内的必读,结果成百上千的科学家逐字审阅,但能看到 IPCC 所使用的都是概率性表达方式 ( 熟悉统计概率的读者可能注意到其措辞:Likely, highly likely etc.),没有绝对的定量结论,这也反映了气候风险是很难精确描述的,尤其是宏观范围。

创业笔记:气候行业是大模型创业的最好场景之一
IPCC (AR5) 对于气候风险的描述
气候风险有分为物理风险和转型风险
创业笔记:气候行业是大模型创业的最好场景之一
情景分析 – 不同气候路径之下的温室气体排放
Hausfather and Peters (2020)
创业笔记:气候行业是大模型创业的最好场景之一
按照领域模拟全球气候变化情况:
气候全球计算器由英国能源与气候变化部、
Climate-KIC、世界资源研究所、
国家发改委能源研究所和能源研发国际(中国)、
安永(印度)、伦敦经济学院、伦敦帝国理工学院、
Climact 气候媒体工厂和国际能源署共同开发
创业笔记:气候行业是大模型创业的最好场景之一
NGFS: Climate risk framework
金融行业主流的气候风险分析一般采纳 NGFS 框架
看到这里,你大概已经能感受这个行业的人每天有多少时间花在读报告和写报告上面了
2
谁需要气候数据?
任何行业都会需要了解气候变化有关的数据,气候问题是发展问题。气候数据不止天气预报,我们更感兴趣的是对未来的判断,以及尽可能小尺度之下的风险评估,来看一段 GPT4 的回答:
创业笔记:气候行业是大模型创业的最好场景之一
来源:ChatGPT
真趋势还是伪趋势
市场是敏捷,但气候问题实在是太复杂了,对于气候变化的监管也滞后于问题的出现。这里借用一下 Sam Altman 对于趋势的判断,“如何区分一个真的趋势和假的趋势,一个真的趋势是,你的用户开始在推荐你的产品”,这也会反映在市场和公司的增长数据中,过去的2-3 年,几乎每一年都有几起气候数据的收并购案例,也有源源不断的创业公司诞生。

创业笔记:气候行业是大模型创业的最好场景之一
Climind团队制作
这个市场有多大?
一般以路演为目的的数字可能会这么计算:

有多少公司会受到影响,他们的AUM大概是多少?
有多少这样的公司有采购新产品的需求?
这些公司的付费意愿与购买力?
我们的思路是,整个金融行业都在因为气候变化问题而改变,数字就显得不那么重要了。传统的固执定价三张表是不考虑环境因素的,所谓“ 负外部性内部化 ”,需要金融企业在未来几年的时间里一定做几件事情:
披露与报告和气候变化,生物多样性有关的表现;
配合新的监管与合规(并且这些法律法规一直在变化);
尝试寻找新的机会与增长。
创业笔记:气候行业是大模型创业的最好场景之一
e.g 气候相关金融法规的发展,Deloitte 2020
结论是,就金融领域来说,气候变化催生的新金融市场几乎是整个金融市场的规模,而且我们才刚刚开始。
5
目前的气候数据方案有什么?
我们整理了一下这个行业目前的解决方案和公司,包括咨询和技术公司,以海外市场为主(国内市场以后另写)。

创业笔记:气候行业是大模型创业的最好场景之一
来源:Climind团队制作
金融领域也衍生出了一个 “Spatial Finance” 的领域,这里列举几个美国和欧洲英国的项目和机构:
智库与学术机构
CGFI 的 Spatial Finance Initiative
CGFI 是我所在的帝国理工气候金融研究院 CCFI 共同成立的姐妹机构(一个由帝国理工,牛津还有英国政府支持的气候变化智库)
Ben 在牛津也成了一个小组专门研究 Spatial Finance
强烈推荐 2022 年 CGFI 在牛津举办的 Oxford Sustainable Finance Summit 2022,邀请了业内几乎所有前沿的科技公司来分享成果
 
2022年峰会的录屏在Youtube能找到【关注我们,输入CGFI峰会,获取播放链接】
创业笔记:气候行业是大模型创业的最好场景之一
NGO

COP26 的会议上,Al Gore 牵头成立了 Climate Trace,一个由非营利组织、科技公司和大学组成的全球联盟,旨在改善二氧化碳和甲烷排放的监测、报告和验证 (MRV)。Climate Trace 的一个发起方是一个伦敦的NGO叫做 Transition Zero,用户大部分是政府,资金来源也以 NGO 和科技巨头为主 (这也是一个神奇的机构,之后有机会再写),前几个月我和 Transition Zero 的CEO (Matt) 一起在帝国理工给学生做了一场讲座,在业内 Transition 的数据质量是非常受到认可的,也参与发表了一些有分量的文章,Matt 这几年的关注也都在发展中国家,最近盯上了中国的煤炭产能和披露。

创业笔记:气候行业是大模型创业的最好场景之一
Climind 和 Transition Zero 的CEO (Matt) 一起
在帝国理工给学生做了一场讲座
6
被严重忽略的用户痛点在哪里
先说正在被解决的一些痛点:
信息差与焦虑感
“我能如何花最少的投入完成‘气候指标’?”
这么大的市场背后,目前用户在购买什么服务和产品?答案是“咨询”。用碳盘查案例来说,即使是头部的美国独角兽公司 Watershed,目前也还在艰难的销售咨询的同时“捆绑”产品给企业用户,打开网页都是“request for demo”, 然后就会有销售人员找到用户开始常规而漫长的2B推广其定制化的软件。Watershed 在2022年开启了伦敦办公室,开始重点进入金融行业,寻求英国欧洲市场的增长。
创业笔记:气候行业是大模型创业的最好场景之一
来源:watershed官网

气候变化是一个复杂系统。

气候数据往往是多模态而互相影响的,学术圈有很多研究 downscall 气候影响的话题,在行业角度,企业拿到的气候数据往往不能直接使用。

7
藏在“水下”但是不可忽视的痛点
宏观的分析对于公司层面来说几乎没有太大意义。
公司需要知道的是气候风险对于某一个特定的资产在特定时间点有多大的可量化的影响,需要如何最有效的合规,再或者是其中有什么新的投资机会。
绝大部分的解决方案太昂贵了,至少对于SME来说,e.g., Bloomberg 2400 美金 / 用户 / 年
我们看到的 6 个气候数据行业未来
  • 开源不能完全解决 transparency 和 integrity 问题,但气候数据开源是不可避免的。所以,加工倒卖二手气候数据的公司会被消灭;
  • 任何一个行业都会和气候变化有业务关系,并且企业相比政府与公共部门会扮演更重要的角色;
  • 因为气候变化因素的影响,所有金融业务需要重新做一遍,数据是关键;
  • 气候数据行业会被懂气候的人工智能公司颠覆,大模型的发展加速了这个过程;
  • 对于气候数据的交互方式将会发生改变;
  • 建立气候金融领域的大模型是必要的,但不仅仅是因为数据安全与隐私问题。
  • 气候数据正在诞生一些变革性的公司和项目,并且这是一个有 deadline 的赛道,别再说双碳是PR了!
这里选择性罗列了我们有接触和充分思考的项目,包括大公司与创业项目:
All in Climate:Blackrock 与阿拉丁
Larry Fink (BlackRock CEO)曾表示,将会有 1000 家价值十亿美元的独角兽公司在气候领域工作。
2023 年 2 月, Climind 受邀在挪威和 Larry Fink (Blackrock CEO) , Bill Gates 共同参加了一个能源峰会 Oslo Energy Forum。作为全球AUM最大的资管公司,Blackrock 在绿色金融上的倡议和行动成为了行业风向标。Larry 提出了一个很耿直的观点,“ we are doing climate finance for our clients, because we are managing our client’s money, not our own”。
创业笔记:气候行业是大模型创业的最好场景之一
创业笔记:气候行业是大模型创业的最好场景之一

来源:Oslo Energy Forum
为什么资管要做绿色转型?因为这样能募集到更多的资金,也能开拓新的产品,降低融资成本,Climate is NOT for PR。Blackrock 旗下的阿拉丁是一个很值得关注的例子,在同行都还在为CSR,ESG焦虑的时候,Blackrock 已经在阿拉丁上开拓气候模块赚同行的钱了。
创业笔记:气候行业是大模型创业的最好场景之一
来源:Aladdin(阿拉丁)
粮食危机之下的数据智能胜出者 :Gro Intelligence

Gro Intelligence 是在气候风险预测的领域目前最受关注的公司之一,由 Sara Menker 于 2014 年创立,使用人工智能来预测全球粮食系统。碰巧遇上了全球粮食危机,而且成功的提前预测,让这个公司一炮而红。

Sara 在2022年 FII举办的圆桌上和老牌金融巨头同台,苏世民,Jamie Dimon, David Solomon(视频 )也充分看到了气候风险在实际的改变金融行业格局

创业笔记:气候行业是大模型创业的最好场景之一
来源:Gro Intelligence
金融行业的大模型应用:Bloomberg & BloombergGPT

Bloomberg 的垂直领域大模型一点也不意外,金融实际上是非常适合做自然语言场景应用的领域,高度结构化的数据,金融行业对信息敏感,也能快速得到训练反馈
彭博社的研究人员分享了一份详细的技术报告,描述了数据集、模型配置和训练过程。摘抄了一些官方给出的评论:
“BloombergGPT将协助彭博改进现有的金融NLP任务,如情感分析、命名实体识别、新闻分类和问答等。此外,BloombergGPT将为整合彭博终端上的大量数据提供新机会,以更好地帮助公司的客户,同时将AI的全部潜力带入金融领域。报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。与此同时,该数据集还与一个3450亿标签的公共数据集结合,创建了一个包含超过7000亿标签的大型训练语料库。这使得该模型不仅在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。”
彭博首席技术官Shawn Edwards表示:“我们认为具有金融领域特点的大型生成性LLM具有巨大价值,原因有很多——少量样本学习、文本生成、对话系统等。我们很高兴能开发出第一个专注于金融领域的LLM.BloombergGPT将使我们能够解决许多新类型的应用,同时它的性能优于为每个应用定制的模型,且上市时间更快。”
彭博机器学习产品和研究团队负责人Gideon Mann解释说:“机器学习和NLP模型的质量取决于你输入的数据。得益于彭博40年间积累的金融文件,我们得以精心打造一个大型、干净、特定领域的数据集来训练一个最适合金融用途的LLM.我们很高兴能够利用BloombergGPT改进现有的NLP工作流程,同时也思考新的方法将这个模型投入使用,为我们的客户带来惊喜。”
一个不太被熟知,但非常值得关注的是,Bloomberg 在 COP27 之后提出的一个 “The Net-Zero Data Public Utility” 尝试从上而下地解决金融机构气候披露数据不统一的问题。如果大模型垂直领域落地顺利,可能就不需要这个项目了?

金融企业的开源气候数据平台:OS Climate

OS Climate 一定是一个意想不到的惊喜,是Linux 基金会支持的开源气候数据库。两年多以来机构一直在 COP 上呼吁共享高质量气候数据,也做了很多技术分享,Linux 基金会的 CTO 也亲自带这个项目。

从最新的进展来看,还是有一些定制化的问题没办法面面俱到,比如最近公开的 PCAF 金融排放数据集,实际作用有待考证,毕竟 PCAF 本身也不是监管规定的核算方法学。而且这一类问题往往最后难在获取能耗数据,不是一个计算问题。

重点是,当开源的数据质量更好了,那还需要购买昂贵的金融气候数据吗?

碳市场的数据平台:世界银行 & IETA打造 “meta-carbon registry”

国际排放权交易协会 IETA 有太多值得讲的,创始人 Dirk 从京都协议时代就开始了这个机构,所以目前也是历史最久的碳市场民间组织。获得世界银行加持以后开始游说各国政府做一个“meta-registry”, 按照世行节奏,项目的进展已经算非常快了,官方公开有30个机构参与,11 个政府支持。

https://climateactiondata.org/

创业笔记:气候行业是大模型创业的最好场景之一
IETA
比尔盖茨创建的突破能源基金 “Breakthrough Energy”
突破能源基金会(Breakthrough Energy)由比尔·盖茨创建,旨在激励全球实现净零排放,开发和推广所需的关键技术。徐博士领导团队,致力于研究净零途径并构建相关开源软件,从而实现可再生能源转型。

国内关于 Breakthrough 的新闻并不多,但自成立以来这个神秘的机构硕果累累,从科研到孵化初创,一直到媒体都有他们的身影。日前Talks at Climind(一档由Climind团队创立的博客栏目,目前已上架Podcast和小宇宙,欢迎关注)邀请了突破能源基金会首席科学家徐熠兴博士,分享能源系统建模的最新成果。

创业笔记:气候行业是大模型创业的最好场景之一
能源与数据:比尔盖茨建立的的 Breakthrough Energy

在节目中,徐博士表示,他是9年前进入清洁能源转型领域,开始着手能源系统项目。当时行业内几乎没有任何相关活动,但一些领导者已经在考虑该问题,比尔-盖茨是其中一位,另一位是微软的前首席技术官内森·米尔伍德。内森后来创办了自己的公司,叫Like Intellectual Ventures,旨在应对气候变化的挑战。但在当时,美国电力系统中几乎没有任何创新,能源系统模型的可信度不高,人们无法了解当前需要面对的挑战,以及未来十到二十年的挑战。即使大家担心或关注未来会发生的事情,也没有任何工具可以量化分析。在这样的背景下,徐博士开启了能源系统建模的相关故事。

AI for Climate Science: OpenAI & Climate

铺垫一下 OpenAI 在气候变化领域做的项目,下一期我们展开说说
OpenAI 在气候垂直领域很早就有探索,从 Sam 的公开演讲,Sam 自己也投资了一个核聚变公司 Helion,建设可实现净电力生产的核聚变设施。但这里我们想提的是大模型在气候领域的两个其他想象空间。
AI for Climate Science
了解气候变化建模的同学可能会很期待大模型在多模态下能够探索的空间,气候变化是一个极其复杂的过程,IPCC 给出了一定程度的科学解释,但是不足以做微观的决策依据。我和 IPCC WG3 的 Co-chair 有机会探讨过这个问题,Jim Skea 是帝国理工的能源系教授 ( 也很有可能是未来 IPCC 的主席),也十分期待人工智能的参与,帮助 IPCC 报告的撰写和文献分析。
AI for Climate Knowledge access
“Climate has been made too complicated” 这是从接触气候领域至今我们的感悟,链接气候数据与具体的方案,这是 Climind 希望第一步做的事情。正如 John Doerr 所说,我们需要 Speed and Scale。
创业笔记:气候行业是大模型创业的最好场景之一
来源:Prof.Jim Skea(IPCC WG3 的 Co-chair)
创业笔记:气候行业是大模型创业的最好场景之一
2023 年的联合国经社理事会召开一年一度的青年论坛,
Climind 和联合国秘书长技术特使 Amandeep Singh Gill
分享了大模型在气候数据中应用的想法
来源:UN Youth Envoy
8
GPT 时代带来碳中和的 Speed and Scale?

Richard Feynman: What I cannot create, I do not understand

自从 ChatGPT 推出,几乎每天一个 Holy * moment,但是目前其实还没有看到To B领域非常成熟的产品,我们相信气候领域会是一个非常适合的场景。

短期:改变咨询 – 重构服务

通过自然语言交互的方式做定制化的 Climate Copilot

气候目前还是一个“咨询”产业,基于信息差的商业模式和重复劳动是最容易被取代的,对于信息报告的信任和背书都是企业的品牌在背书,包括气候数据也是基于“背书”的逻辑。辅助与一定程度替代咨询这只是个时间问题,对于初创公司来说或许会有一定信任门槛,所以高质量的数据源至关重要。

GPT-4 给人的感觉就像一个粗心但博学的咨询师,打字很快,知道很多知识,但是容易混淆。但实际场景中,人们需要也并不是一个完全的替代,而是一个24小时工作的高效定制顾问。如果能通过对话的方式呈现,那极大降低了成本而且有巨大的知识储备。

中期:气候数据表达的重构 – 重构信息与检索

我们指的是两个方面的信息与搜索.

1. 让复杂的信息更容易给人用

  • 大模型与多模态数据库的交互来实现更精准更简单的信息搜索;
  • 目前气候信息的呈现并不是按照大部分人理解的角度去解读与呈现的,比如遥感信息;
  • LLM 的一大价值在于他们总结和组织信息的能力。The Killer Use Case for LLMs Is Summarization.

正如网络彻底改变了我们查找、消费和消化信息的方式一样,气候领域也将如此。然而与网络不同,LLM 将实际解释我们的信息,而不仅仅是提供一种传播、索引和发现信息的方式。

2. 重构气候数据呈现的方式和可能是优化大模型的新思路

  • 大模型需要的可能不一定是结构化的信息;
  • GPT2,3 的训练依赖于tokenization,把数据统一成token stream,对信息没有进行人类可理解的结构化处理。结构化的信息是人理解世界的方式,不一定是二进制的计算机理解的方式;
  • Positional encoding,尤其是对于图像信息,通过构建机器更容易运行的数据,保留更关键的信息,加入大模型训练,从而提升大模型训练的效果;
  • 假设未来 5-10 年大模型不会被颠覆,重构气候数据会成为模型的“utility”;
  • Domain knowledge 会是涉及新的数据结构的关键.

长期:AI for Climate Science – 重构气候风险评估体系

创业笔记:气候行业是大模型创业的最好场景之一
Climind创始成员Mingfei 在课堂上给学生的分享,2023

人类对于气候风险的了解是非常初级的,尽管有复杂的模型和情景分析被创造出来尝试描述这一问题。我们认为,只有能精确描述个体和公司的气候风险,模型的结论才具有实际意义。

相比生物,气候变化作为一个同样未知而充满紧迫感的领域,气候领域的 AlphaGo 还未诞生,这也是 Climind 团队长期的研究方向 – AI for Climate Science。

最后,如何拥抱变化?

“There are decades where nothing happens; and there are weeks where decades happen”

— Vladimir Ilyich Lenin.

LLM 时代,如果做一些有用的气候数据产品?两种思路,一种做的事情刚需,迅速提升技术壁垒和市场份额;另外一种,这是个全新的市场和领域。气候主题时代下的市场,两者都是。

有关我们

Climind 有一个浪漫的中文名字 – 蓝点起源, 致敬 Pale Blue Dot

1990年2月14日,美国国家航空航天局(NASA)的旅行者 Voyager1号太空船在飞离太阳系的过程中向着它背后的一次回眸,是它在距离它的母星地球64亿公里外给太阳系拍摄的一组全家福照片当中的一张,当中地球的大小只占整张照片的0.12像素。美国著名天文学家卡尔·萨根 Carl Sagan 博士因这张照片得到灵感,写成了《暗淡蓝点 Pale Blue Dot》。在“暗淡蓝点”(Pale Blue Dot)照片上,地球是孤悬于广袤空间中的一个淡蓝色像素。阳光散射而成的条纹铺成背景,其中一道恰好穿过了地球。

创业笔记:气候行业是大模型创业的最好场景之一
“Most Good Quests are Hard”,
then the question becomes,
where do you choose to dedicate your life?
彩蛋
 
最近,我们在联合国总部分享了一下 Climind 做的事情
创业笔记:气候行业是大模型创业的最好场景之一
© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...