
1. 前言
ChatGPT 是一种基于深度学习的人造言语处置技术,可以了解和生成人类言语。与其余人造言语处置技术不同,ChatGPT可以自我训练和生成少量的文本数据。这使得ChatGPT成为了一个弱小的工具,在多个畛域都被宽泛运行。
假设可以经过与ChatGPT对话的形式,智能提取数据和可视化剖析。这将是一件十分 Amazing 的事件!
本文将讨论如何应用 ChatGPT 成功智能数据可视化方案。
2. 方案探求
经常使用过 ChatGPT 的好友都知道,Prompt(揭示词)是协助咱们经常使用 ChatGPT 技术的关键。Prompt 是一种冗长的文本片段,用于向 ChatGPT 提供高低文信息和指点。Prompt 可以蕴含疑问、义务形容、限度条件等,以便 ChatGPT 了解用户的需求并生成更准确的照应。
例如,在BI数据探求中,一个揭示词或者是这样的:“请显示去年每个季度开售额最高的产品。”在这个揭示词中,咱们提供了期间范围、挑选条件和希冀结果。ChatGPT 可以经过了解这个揭示词,智能提取数据,并在图表中出现出合乎条件的产品和开售额数据。假设咱们须要进一步了解某个产品的详细信息,咱们只有要提供更详细的揭示词,例如:“请给我展现去年第一季度开售额最高的产品的多少钱和库存状况。”
Prompt 的设计十分关键,由于它间接影响到 ChatGPT 的照应品质。好的 Prompt 应该具备以下特色:
所以,要想充沛应用 ChatGPT 技术来成功可视化剖析,优化 Prompt 设计至关关键。笔者以为有两种思绪可以思索:第一种是经过 Prompt 疏导 ChatGPT 生成共性化的可视化剖析介绍,并将性能提交给申明式可视化言语(Vega),以便间接启动可视化展现;第二种是经过 Prompt 疏导 ChatGPT 生成数据查问 SQL,而后经常使用社区中的智能化剖析工具(例如 )对失掉的数据智能可视化展现。
上方将区分引见这两种方案的成功。
2.1 方案1:ChatGPT + Vega
Vega是一种申明式的可视化言语,用于形容数据可视化图表和交互式视图。它支持多种图表类型,包括散点图、线图、柱状图、区域图等,并准许用户定义各种视觉属性,如色彩、大小和状态等。Vega经常使用JSON语法,并提供一个基于Web的编辑器Vega Editor,可以协助用户极速创立和修正可视化图表。它还提供了一系列工具和库,如Vega-Lite和Vega-Embed,以便在不同的运行场景中经常使用。
咱们可以应用 Prompt 提供关键字、指标群体、所需的剖析结果类型等高低文信息,ChatGPT 可以依据这些信息智能生成生命式可视化剖析介绍,而后将其性能提交给申明式可视化言语 Vega,便可以成功智能数据可视化。
这种方法适用于须要高度共性化的场景。
成功流程如下:
首先用户提交正当的 Prompt 提交可视化需求给 ChatGPT,ChatGPT 经过 Prompt 智能生成数据查问 SQL 和 Vega 可视化 JSON 性能,而后将 SQL 提交给数据库失掉剖析数据汇合,最后讲 Vega 性能信息和数据集输入给 Vega 渲染引擎,就可以绘制可视化图表了。
成成成果如下:
可以经过此链接检查
2.1 方案2:ChatGPT + AVA
(A Visual Analytics) 是为了更简便的可视剖析而生的技术框架。它是出自阿里巴巴团体( )技术框架(又一个出自阿里大厂的开源框架,说瞎话,阿里国际我最青睐的开源奉献大厂,没有之一!),其指标是成为一个智能化( )、智能驱动( )、支持增强剖析( )的可视剖析处置方案。
AVA 的全体架构如下:
依赖 AVA 框架的弱小设计,咱们只有要提供数据给它,它就会基于输入的数据集,智能启动剖析和洞察。所以,方案2 的外围就是如何极速精准的失掉到用户想要的数据。
成功流程如下:
应用 Prompt 蕴含数据范围、挑选条件等高低文信息,ChatGPT 可以智能生成相应的 SQL 查问语句。而后再将 SQL 提交给数据库失掉数据,最后交给 AVA,智能成功数据剖析和洞察剖析。
成成成果如下:
可以经过此链接检查
3. 名目源码
两种方案代码比拟方便,这里就不贴进去了,感兴味可以间接阅读名目源码。 。名目服务端经常使用 NestJS 成功,前端经常使用 UmiJS + React + Antd。
名目服务端运转前,须要领有 OpenAI 平台的 ,假设国际用户没法失掉,可以经过 平台失掉 和 。间接性能到名目根目录的 文件即可。
文章 banner 图是经过 AIGCaaS 平台提供的 生成的。生成 Prompt 性能如下:
4. 总结
对比以上两种方案,不美观出, Prompt 设计是成功 ChatGPT 技术可视化剖析的关键 。经过正当设计 Prompt,咱们可以更好地利用 ChatGPT 技术,并以更高效的形式启动数据开掘和洞察。无论是经常使用共性化可视化剖析介绍还是智能生成 SQL 查问语句并经常使用智能化剖析工具,正当的 Prompt 设计都可以让咱们比以往更轻松地发现数据中暗藏的价值。
当然除了 Prompt 设计,咱们还须要思索查问效率。咱们无法能每次提交 Prompt 都经过 ChatGPT 启动回复,毕竟这个环节是很费时的,特意是对话高低文比拟复杂的时刻,即使经常使用 GPU 也或者须要数秒或以上的期间。因此,对 ChatGPT 结果启动缓存是很有必要的。
一种经常出现的缓存战略是将 ChatGPT 的输入结果与 Prompt 保留在一个键值对中,以 Prompt 为 key,ChatGPT 输入为 value。这样,在接纳到新的 Prompt 时,咱们可以首先在缓存中查找能否曾经有对应的输入结果。假设找到了,间接前往缓存结果;否则,再调用 ChatGPT 启动计算,并将结果存入缓存中。详细方案还有好多,大家可以亲身尝试。
5. 未来展望
随着人工智能技术的始终开展,ChatGPT 等人造言语处置技术将变得愈加弱小和遍及,并且更好地与可视化剖析相联合,为用户提供愈加直观和高效的数据洞察形式。
未来的可视化剖析也将愈加注重共性化和交互性。即使是同一份数据,在不同的用户需求下所出现的图表也应该是不同的。因此,咱们可以等候 ChatGPT 技术能够更好地理解共性化的 Prompt,并智能为每个用户生成合乎其需求的图表和剖析结果。此外,交互式探求和剖析将成为趋向,这将始终冲击传统的人机交互形式。
智能化可视化剖析还有许多或者的改良方向。例如,经过更深化的对话,ChatGPT 可以更好地了解用户的关注点和需求,并提供更精准的照应;经过联合常识图谱等常识库,ChatGPT 可以更好地理解复杂畛域的专业术语和语义规定,从而更准确地生成剖析结果。
写在最后,以上就是笔者近期经常使用 ChatGPT 的一些探求心得。关于AIGC技术,笔者也在始终学习中。宿愿本文能起到抛砖引玉的作用,假设大家有更好的思绪,欢迎评论区留言。