如果您正在阅读本文,您可能已经在数据行业找到了一份工作,或者正在寻求进入该领域。
随着过去一年生成人工智能领域取得的所有进步,您担心数据科学工作是否会被自动化取代。
一年前,如果有人提出将数据科学工作自动化的可能性,我会嗤之以鼻。我们编写代码,构建机器学习模型,分析数据,并将复杂的信息分解给非技术利益相关者。我们的工作很困难。这些技能需要多年的磨练。人工智能可以提高数据团队之间的效率和协作,但它不可能取代我们正在做的实际工作。
然而,那种情况是在 发布之前。
从那时起,我们见证了生成人工智能领域范式转变的进步。
在这篇文章中,我将根据生成式人工智能领域的现有发展,重新评估我对数据科学未来的立场。
我将提出一系列观点,解释为什么 可能取代数据科学家,以及它可能不会取代的原因。
我将研究辩论的双方,并让读者做出明智的决定,看看生成式人工智能是否会让数据科学家变得过时。
坏处:这就是数据科学工作面临风险的原因
1. 可以快速编写代码
数据科学家花费大约40%-50%的时间编写代码。
不仅可以编写代码,而且变得非常擅长,速度非常快。
已经通过了多家顶级公司的编码面试,可以将手绘草图变成成熟的网站,并在几秒钟内根据用户故事构建数据库表。
事实上,该软件公司首席执行官表示,该模型将完成编码任务所需的时间从9 周缩短到大约几天。
效率提高了 20 倍以上,这将显着减少组织完成编程任务所需雇用的人员数量。
2. 可以摄取和分析数据
现在,您可能会想,“编程只是数据科学家所做工作的一小部分。我们的工作涉及机器学习建模、统计分析以及向利益相关者提供见解。”
嗯, 也可以做这些事情。
该模型的新代码解释器 Code 插件现已更名为” Data “高级数据分析,允许您在 界面中上传和分析数据。
以下是高级数据分析插件根据纯文本需求构建客户细分模型的屏幕截图:
图片由作者提供
该模型能够预处理数据集、找到 K-Means 聚类的最佳聚类数量、构建算法,甚至根据模型的输出提供数据驱动的见解。
据《商业内幕》报道,编程和分析相关的职位是被人工智能自动化取代的风险最高的职位之一。
研究人工智能对美国劳动力影响的布鲁金斯学会高级研究员 Mark Muro 声称,这是因为 可以比人类更快地生成代码,并且擅长分析数据和预测结果。
3. 弥合人类与技术之间的差距
许多非技术利益相关者都很难阅读 Excel 工作表中呈现的数据。这些人都很忙碌,他们需要用简单的英语呈现简单、直接的结果。
例如,营销团队会提出“哪些客户最有可能再次购买产品 X”之类的问题,并期望您在几张幻灯片中给出答案,突出显示推动重复购买的预测指标。
作为一种语言模型,这样的用例正好符合 的范围。
你可以问它以下问题:
我从事营销工作,没有任何技术背景。
您能否根据此数据集解释一下我的哪些客户最有可能
再次购买产品 X?原因是什么?
不会为您提供复杂的图表和计算,而是会准确地告诉您需要了解的有关客户数据集的信息,为您提供做出数据驱动的营销决策所需的知识。
的对话能力与其技术能力相结合,可以使数据科学和分析等领域民主化。
曾经需要您熟练掌握 Excel 或 的任务现在可以使用高级数据分析插件等工具轻松完成。
此外, 刚刚发布,允许公司为其员工购买语言模型的订阅。
称其为“迄今为止最强大的 版本”,因为它没有使用上限,并且执行速度提高了两倍。它还提供对高级数据分析插件的无限制访问。
由于该版本的 符合 SOC2 标准,因此员工可以将专有的公司数据集直接上传到 界面,而不必担心泄露敏感的公司信息。
好的一面:为什么你的数据科学工作是安全的
好吧,前面部分中所有的厄运说法读起来可能有点令人沮丧,我几乎可以看到你们中的一些人对着屏幕摇头,不同意我提出的观点。
但不要害怕!
我们现在将深入探讨更令人放心的方面,并探讨为什么业内许多人认为数据科学工作是安全的(至少目前是这样)。
1. 无法进行复杂的数据分析
数据科学家(和分析师)通常从多个来源收集数据,并使用一系列工具从中获取见解。
这项工作并不像使用高级数据分析插件将单个数据集上传到 那么简单。
例如,我目前正在进行一个项目,需要我分析数千个 PDF 文件。
由于规模庞大,这样的任务非常具有挑战性——需要处理大量数据,并且每个 PDF 文档都包含不同类型的信息,例如表格和图像。
对这项任务没有太大帮助,因为它无法访问必要的包来分析甚至一个文档:
当然,它能够帮助我编写提取和分析数据所需的代码,但没有编程知识的人将无法运行、验证或调试代码。
此外,大多数公司将其信息存储在 SQL 数据库中。
高级数据分析插件仅限于文件上传,这意味着它无法直接与公司数据库交互。
您仍然需要具备数据库管理和 SQL 查询所需技能的人员来访问、解释和分析这些数据库中的数据。
2. 无法模拟人类决策
畅销书作家、领先的商业和数据专家伯纳德·马尔 ( Marr) 表示,即使是最成熟的法学硕士也缺乏批判性思维、战略规划和解决问题等能力。
这些模型无法深入了解业务的内部运作,也缺乏领域专业知识。
如果您问“为什么产品销量在过去 2 个月里大幅下降”,该模型将缺乏有关您组织的必要背景信息,无法为您提供明智的答复。
此外,人类分析师或数据科学家经常接触组织内的不同团队——我们询问他们当前面临的问题,深入了解业务问题,并提出解决策略。
另一方面,法学硕士无法像人类那样参与协作解决问题。
3. 出错
最后,容易产生幻觉。它在编写代码、解释数据和生成见解时可能会犯错误。
大多数组织都不会承担根据人工智能生成的数据做出业务决策的风险。
仍然需要人类专家来验证人工智能模型生成的代码和输出。
事实上,许多组织目前在做出决定之前都有两种生成预测的方式——内部数据科学家团队和外部咨询公司。
对这两个实体生成的数字进行比较,并经常进行协调,以确保预测一致。
如果公司愿意花费数十万元聘请第三方咨询公司,只是为了在决定如何进行之前交叉验证他们的预测,你真的认为他们会用人工智能模型取代数据科学家来削减成本吗?
如果你问我的话,可能性极小。
在我看来,人工智能生成的预测将作为基线——它可能成为组织验证其数据科学团队提供的见解的另一种方式。
假如我从事数据科学工作。我如何才能为我的职业生涯提供人工智能证明?
首先,你必须拥抱人工智能。用它来掌握行业趋势并学习新事物。假装人工智能不会显着改变你的工作方式,弊大于利。
相反,使用生成式人工智能模型来自动化部分工作,并利用效率提升来开发技能,使您在该领域中脱颖而出。
此外,前元数据科学家Tina Huang建议您建立多种收入来源,而不是仅仅依赖全职工作。
您可以开始提供自由数据科学服务来获得被动收入,确保您的工作保障不依赖于单个雇主的决定。
最后,我个人认为,组织在招聘员工时所青睐的品质将会发生变化。传统上,工作要求非常重视技术技能——您在 Excel、编程或 方面的表现越好,您被雇用的可能性就越大。
我相信重点将慢慢从工具和技术专业知识转移,因为生成式人工智能模型正在缩小这一领域的技能差距。当然,技术技能仍然很有价值,但它只能让你走到这一步。
相反,组织将开始青睐沟通、创造力、领导力和决策等技能。
对于雇主来说,了解如何利用人工智能来实现公司目标的人比仅仅提供技术专业知识的人更有价值。