chatgpt 回车键发送不了信息 GPT产品需求设想&解决方案/工具

默认分类2个月前发布 admin
3,500 0
ChatGPT国内版

需求描述

我的目前解法和问题

我有工具推荐可解

微信里的对话、内容或链接,总结摘要

转发出去就返回一个摘要

1 目前需要自己复制粘贴内容给GPT

2 用收费或开源工作流工具+邮箱+GPT处理。微信转发聊天记录到邮箱,然后自动进行摘要返回。(建议一个专门的GPT专用邮箱)

我们针对这个场景专门做了一款产品,发送文章链接自动返回摘要,搜索会读也可以关注我们

AI 音视频管理工具

管理本地的音视频文件,音视频文件转录成文字,基于转录结果生成内容摘要,生成播客 Show Notes,视频文件生成字幕。

目前基于 Open AI 的 模型做了一个初期的版本已经上架了。

阿里通义听悟

自动翻译

不用点进去里面就能自动英文翻译

用油猴脚本,搜翻译机可解。

目前翻译用的谷歌翻译,希望能支持或DeepL翻译

沉浸式翻译完美解决:

油猴脚本-翻译机

– BOB机器人

和网页对话

不仅能总结网页内容,还可以继续多轮提问,最好还能提供衍生的相关内容

目前需要自己复制粘贴内容给GPT

1. Edge浏览器的必应GPT

2. .im 插件

3.推荐插件:Read

自动编曲

哼唱一段旋律,自动生成完整的曲子,加上歌词变成一首歌

ace 有但还未开放

暂无

没有字幕的视频加上实时字幕

没有字幕的视频加上实时字幕

目前没有看到产品

快速阅读PDF论文

对PDF格式的文件可解析并阅读,提炼重点

/。经常胡说八道,总结抓不到重点。

通过一键部署一个PDF+GPT到自己网站

英语口语练习

一个AI私人英语学习教练,最好是非常真实的虚拟人,每天提醒我学英语,交流讨论特定场景问题。了解我的能力水平,能纠正我的发音,有明确的学习线路和激励反馈。

1. 体验很好,但过于开放,不知道聊什么,也不是专门练习口语而做。缺乏类似多邻国的学习线路和激励反馈;

2. 有模板场景,也可自定义场景,但是每个场景有对话次数限制导致无法将对话深入;

,,Speak Read、、多说、(小程序)

长文章摘要总结

现在的文章摘要工具可总结内容太短,而且抓不到重点;最好能有可调节总结颗粒度的工具

等摘要工具,但是太长的会自动丢掉,分段总结合并也会失真。等不到32k API而且价格贵,希望有更好的解决方案

,

无障碍跟老外打字沟通

读翻译后的非中文,想评论但语言不通,想用中文评论,自动翻译成对应的语言发出去。

手机上用,设定对应语言翻译,切换键盘点击翻译发送。

电脑上没有类似的输入法工具。

希望输入法原生解决,不需要装多个输入法键盘。

微信键盘-边写边译

输入后,直接翻译+回车上屏(不是输入法)

装这个插件可解

电脑网页上可以输出汉字然后用里的deepl官方插件选中点击直接替换

面向老人的聊天机器人

我母亲年龄大了以后眼镜近乎失明,没有了以前的社交圈,几乎都在家待着。缺少一个日常聊天的伴。

我先后买过喜马拉雅和小米的智能音响,但是互动的效果还是不好,基本就是用来搜歌和小说听

我做了针对小孩的,短视频演示地址:6.15 Zzg:/ 复制打开抖音,看看【任亚军的作品】自制一个智能音响,给小朋友做陪伴助理。# chat…

画一个草图,生成页面

草图也可以不用那么草,主要是提高产品原型的制作效率

国内设计产品:“即时设计”。最近全面开放了AI创作,可根据生成产品设计稿并进行切图和标注,目前只支持设计移动端的产品原型

1. 即时设计 2. .ai

智能记账本

自然语言交互,自动识别关键信息记账,智能分类

例如语音输入今天买了个手机7000块,识别日期金额分类备注并记录

手动输入金额,选择日期分类,填写备注

挖财记账可以语音输入,但是识别不准

帮助人们优化提示词

期望迭代一种提示词

可以通过追问用户一些细节

优化生成更优质的提示词,以便得到更好结果

已解决,使用

抓取指定信息,展示阅读

根据信息源(网址,RSS,,微信群等),或者自定义关键词(关键词,标签),推送指定最新信息,可根据指定形式筛选(筛选:时效性,专业度)

目前是用

小程序:

阅读论文pdf(辅助性)

论点从上到下的翻译和总结

图表数据阅读和整理不是很好

AI输入法键盘

AI输入法,可以内置各类和设定助手,比如多语种翻译、AI润色等等,将用户的输入进行转换后输出

目前来看输入法集成这些很方便,已经有键盘拓展可以解决,但不是很原生,体验有割裂感

结对编程

帮助程序员完善代码,自动生成一些简单的算法和代码,提高编程效率

对初级程序员更有用,一般程序员都是老带新,而且不同行业的技术栈差异很大

文本【不限题材】拆解工具

根据提示词和自然语言拆解要求,能将输入的文本按照要求进行信息捕捉和拆解归纳

1.利用GPT4提问的方式,根据使用者提出的要求、和提供的样稿进行拆解;

2.问题:处理文本数量有限;网页C端使用限制,记忆能力有限;无法总结出模型用于长期工作生产;

暂无

商品购买建议

GPT-3 + web 插件 + 特定。不建议开发,因为强需求,平台会做。

GPT-4 + web 插件 + 特定。不建议开发,因为强需求,平台会做。

,目前基于消费者真实体验,帮助消费者生成评论和卖家收集评论。中期准备做以真实评价为出发点的第三方点评和种草平台。主要面向海外市场

群聊总结机器人

群里聊天记录爆炸,一个一个翻较麻烦,需要一个总结群聊关键信息的 gpt

1 爬取群里内容,扔给 GPT 做总结

2 可尝试用 + 云服务 方式尝试?

自动竞品分析

指定产品,自动抓取data.ai等统计分析工具中的下载量、DAU等数据,抓取官网产品介绍、新闻报道等,生成对比表格

目前靠人工手动收集整理

可视化学习

给出一个名词关键词,自动生成图片甚至是3D画面,每个组成都有标注,可以点击探索学习,帮助孩子学英语和其他知识

åååå

chatgpt 回车键发送不了信息 GPT产品需求设想&解决方案/工具

上传一个文档(word/pdf),用GPT翻译,生成新的文档

就是一般理解的翻译文档,保持原格式

沉浸式翻译。只能双语对照,并且不是所有文档都能翻译

里面的翻译书籍插件

针对于设计师模拟文案提效工具

相比于GPT,内置常用文案模版,例如新闻评论(20字),留言(10字),个人简历(50字)等。还可以生成特殊格式,例如XBK++(0-1000)排序的数据;中英文结合数据,前面如何,后面如何这种。根据业务不同可以生成比较真实的数据,减少设计师文案黑洞。

暂无!figma插件 Reel 可提前编辑内容,填充假数据。但是源数据还需手动创建。

1.市面上没有

2.能够提升设计效率

3.交付真实,针对于特殊业务特殊格式的数据生成

对于设计是硬需求,你是开发的话可能不太能体会,输入一个数据一个数据的折磨

总结所有文章

总结我正在看的文章,并输出关键结论

需要复制链接发给gpt-4 或者使用 的副驾驶,对于国内来讲,很麻烦。

考虑Glasp?收藏高亮的同时收藏文章。养熟了之后是不是可以根据高亮输出结论?

用自己的声音给孩子朗读自己编的故事

用的语音合成+生成故事,自动生成故事朗读,可以和上面的绘本组合就更好了

目前都需要自己搞,流程复杂

亲人留念机

很多人对逝去的亲人怀念,会听遗留下来的语音,看留下来的视频照片

目前的ai技术是很好能帮忙得到的,也是一桩善事

这个日本好像有了

我们做的灵魂刻录机快上线了:

A-灵魂刻录机简介

做个人人都能用的编程器

目前大部分编程都是用GPT4,,希望有一款从0开始的特定编程,比如通过填写对应的产品功能(目前 可用,但是实际要开发还要一段时间),配置开发环境选项框(例如系统:,linux,mac),开发语言选项框(,PHP,Java),部署生产环境选项框(Web应用,APP,桌面端),AI自动生成对应的工程级源码文件(API可自配),以及部署教程

目前用GPT+人工

本地多语种视频总结

本地电脑中下载了数小时长的课程视频,课程所用语言含中英日等多种语言,需要梳理出内容结构、要点。

暂无

长文字自动拆分后发给gpt

超出字数限制的时候,自动分成多段发出

目前是自己凭感觉拆

好像支持的

简单化的自制绘本

把生成的故事,自动生成风格一致的绘本。

目前的制作流程太复杂了,一般人用不起来

私域CRM机器人

爬取用户聊天记录和朋友圈,订单信息(电商平台有api)针对用户特征进行个性化回复。

更懂该用户喜好的智能客服,定期回评用户最新朋友圈,给出贴合内容与客户喜好的点评留言,触发特定词或商机,提醒人工介入接管

目前没见到类似产品

定制化香水

根据不同女性的数据特征,用AI模型生成特定的香型

需要收集大量女性特征数据和偏好香型

保持一个gpt的永久记忆力

一个对话可以永续带有最关键的信息聊下去,比如模拟某个人或者职业身份,或者带有翻译之类的任务

隔一段时间重复一下

AI语音识别提词器

可以识别讲话的内容,自动对应文稿内容,实现自动翻页等功能

国外有能识别英文的提词器软件,国内鲜有相关软件,有也做得效果不好

AIGC Digg平台

做一个国内的AIGC digg类工具,自动抓取AI新闻翻译+GPT初筛,人肉点赞,点踩筛选出当天最重要10条资讯

暂未看到

—-爬取今日头条前十条新闻

法律鉴定意见

需求:目前市面上没有针对中国法的详细的案例鉴定和分析生成工具

1. 法律数据库

2. 按请求权框架拆解法条

3. 判例匹配和请求权逻辑生成

4. 证据补充提示和场景推演

RSS 排序摘要

读取每天的 RSS 订阅内容,做出摘要,按重要程度、内容质量和我反馈的感兴趣程度排序。

+ GPT?

多语言化网站

把个人博客双语化(中文、英文)

网站英文化能大大提升搜索流量

自己写中文英文

辅助工具

目前生成图片的质量参差不齐, 生成五次可能只有2张是能用的。如果关键词已经固定, 能不能同时用多个账号自动生成30张图,然后我再从中挑最好的?或者引入AI对图片的质量进行评估,按图片质量好坏排序。

我在用生成动漫头像,要手动生成好多次,才能挑出能用的,像抽卡一样。还要仔细检查手指的数量对不对。

我做的一款批量生图小插件

批量出图

心理疏导 / Life coach

– 需求:随着经济大环境变差、阶级固化、内卷加剧,大家在心理疏导上的诉求一定在不断攀升,但除了和亲友倾诉、花大钱长期找心理咨询,没有太好的方式。

– 能力:网上很多案例可以看到,在普通的心理疏导上有较为积极的三观和吊打人类的耐心。

– 优势:

a) 价格低廉:市面上比较正规的心理咨询大概300-800元/小时,而且我国没有进医保

b) 永久记忆:AI可以记住你倾诉过的所有内容,不会像找人倾诉,换个人要从头讲一遍(很多人因为这个原因很难换咨询师)

c) 没有心理负担:不会担心其他人是否有时间、有耐心,或者听了之后有什么想法

d) 比市场平均水平更规范:目前市场上鱼龙混杂,系统平台至少可以保证兜底情况,且能不断学习新方法,不断自我进化

– 风险:

a) 危急的严重心理情况,需要及时引导就医,明确平台局限性

b) 软色情等方向管控

有诉求的广大群体,大多数还是通过亲友沟通的方式(但很多人甚至找不到靠谱的倾诉对象),他们很难知道如何使用,也很难有经济能力负担专业咨询费用,更有甚者会被不道德的从业者误导。

清华的聆心智能好像就在做这件事情

glowe阁楼

碎片化信息整合化

比如做一个用户调研报告,会收集不同类型用户的反馈信息,内容包含:功能类,体验类,内容类,但很口语,同时还要结合当前产品和竞品,最终输出可落地的报告分析框架和结果

自己梳理,会使用思维导图、表格、可视化信息图表等等多种展示方式来呈现信息

电影翻译机

英文原声转国语原声,同时对上口型,以及同样的音色和语气

这个国内不过审,只能生成了自己看

这个可以配音频,但不可以对口型

如何让AI更好的处理机器输入的传感器数据(SLAM,,头部IMU,Mic等),达到比用户自己更了解用户的效果

– AI能够处理大量的,混沌的,先前方法效率和性价比很低的数据,这些数据相当于是人的数字版,能够处理这些数据相当于能够构建一个比用户自己更了解用户的AI;

– 手机、电脑和外置监控带来的数据不足够持续和全面,不能完整的描述用户,AR眼镜的传感器数据是最合适的;

– 如何能够在第一步验证这个想法是现在纠结的点,因为整个系统虽然很有价值,但复杂度太高了

研究SAM和,但都还没找到裁剪和应用的方法

书籍拆解

比如说,我看到一本电子书,想要把书本中重点以及段落概要输出,最后汇总成一篇完整的书籍解析。

暂未发现有好用的软件,识别不准确,生成结果不理想

同类里好一些,但也没那么精准:

自媒体账号矩阵系统

开发自媒体账号矩阵系统,利用GPT自动抓取最新榜单和热点

可以根据不同需求选择创作题材并且自动化创作和编辑视频内容

然后选择最合适的媒介进行传播,并且根据用户喜好数据不断优化创作策略,提高视频精准度和质量

chatgpt 回车键发送不了信息 GPT产品需求设想&解决方案/工具

正在开发中

类似lingq且融入ai的英语阅读应用

融合类似微信读书的批注功能,lingq的可视化功能和ai问答为一体的应用

医学数据核查+编码

临床药物研究,对病症做科学描述(以编码为例,比如拉肚子的编码为,学名腹泻”())。另外想通过AI做病历核查,比如通过 体重 + 年龄 白细胞等多个检查项目校验癌细胞指标测量结果,让各个指标能互相校验

目前在临床研究领域需要由专业人员(CRC、DBD)手动编写逻辑表达式,效率很低

rave edc

运营+文科研究用爬虫+数据分析器

填入API和筛选条件自动抓取,等平台信息。比如“竞品本周最火的一条帖子。上面向欧洲市场三万粉以上的”。抓取后自动生成表格或发送到邮箱

1. 用分解问题,直接有答案的直接用。给出代码的搬到上跑。技术门外汉经常遇到代码报错,安装不上库的问题。

2. 手动输入抓取少量的内容的,再进行筛选

在手机上运行语言模型

有些信息只能在本机调用,力量不用很强。

上有,一运行就发热死机,pixel 7上期望能用上,更自由一些。

可以考虑模型分层级调用,终端跑小模型,处理一些简单常用的问题,对于比较复杂问题发送给服务器端大模型处理

给孩子取名字

对接或者其他大语言模型,用户输入孩子姓氏、性别、取名字的要求,AI给出名字建议。

提前设计好几个不同的模板风格

取名软件有

历史学习辅助

需求demo:中国史、世界史的文献和专业书籍内容可以按照年代、国家、人物定位到结构化信息内容。

用户:历史爱好者、内容脚本生成、历史学习。

延伸价值:建立全量历史资料库提供信息支持

1. 信息抽取:使用大量专业内容训练

2. 输出信息:按照年代、国家等构建页面结构

电商单品推荐

假设数据样本足够,是不是可以根据同类身材类型做品类sku的推荐

比如,输入三围,得到是梨形身材,再给出梨型身材都在买的连衣裙;叉乘上用户的消费力、风格偏好、年龄选择

//有没有人懂在淘宝上找衣服到底有多难这件事

没有解法,全靠买回来试错

ps,可以结合下第二行的好评,不过也看个体差异,比如我就不看好评,觉得参考价值不太大

可以小红书关注同样身材、风格的博主

内部Wiki/用户手册改成提问查询

内部所有Wiki 和用户手册做成进行查询

考虑到内部信息保护,需要私有化部署LLM模型且保证有GPT4的处理能力

找东西工具app

耳机、眼镜等找不到的时候,告诉手机帮我找“眼镜”,然后拿着手机转一圈,自动找到。

1. 语音交互

2. 图像识别

3. 找不到的东西通常可能在哪里的知识库(:))

暂无

XR 合成虚拟人

结合前面的亲人留念需求,以及成熟的数张相片合成生成头像技术,进一步生成虚拟人,以及AI语音模拟本人,生成希望获得的虚拟人进行视觉条件下对话或其他互动

其实目前技术都成熟,就看pico做不做,难点仍然在审核和配套的元宇宙/虚拟空间场景, MVP是单一场景下视频对话工具

清华沈阳老师团队已经做出来了,微博搜索可见

宠物疾病诊断工具

拍几张照片诊断一些明显的宠物疾病。

BI看板设计和优化

基于给定的脱敏数据和看板设计需求,AI生成看板设计图。

设计人员完成设计给予优化建议。

人工手动设计、被他人推翻再修改。

线上试装

在电商软件买衣服,每个人的体型身高不一样,衣服穿在身上肯定也是不一样的,需要拍照换脸或者选择脸型发型,输入身高体型后,自动有相应衣服的尺码在旁边显示,衣服在屏幕上显示可3d查看,这样能更直观知道这个衣服穿着身上是什么样的

AI家庭计算中心

1. 现有智能音箱的进阶版,但形态和能力大幅增强,变为刚需

2. 有听说读写能力,比如说:

小爱同学,我眼镜放哪里了?

小爱同学,琦琦的语文作业放哪里了?

小爱同学,你看我这花是不是该浇水了?

小爱同学,看看我煮的菜熟没熟?

小爱同学,在电视上播放上今天的新闻联播

小爱同学,王老师发的报名表帮填一下并打印出来,加上我的签名。

小爱同学,让大力给琦琦出几道三年级数据题做一下。

小爱同学,帮老人读一下药品的使用说明,一次吃几片?

小爱同学,帮我数一下琦琦的跳绳个数、速度。

小爱同学,帮我买些夏天在衣服(多轮会话+电视交互+试穿效果)

现有细分领域能力的一个整合产品,整合的能力包括:

1. 物品识别+对话

2. 动植物病虫害诊断

3. 网路信息获取+人机交互

4. 本地信息获取+

5. 与大力智能灯等交互能力

6. 与家其电视都其他设备交互、主控

操作系统自然语言编程

( line)

程序员写的代码只能满足用户最常用的需求,但其实用户有很多小场景需求一直处于未满足状态。用户可以下载一些三方应用来解决这些长尾需求,但是由于只有用一两次,成本就比较高。

这部分需求开发成本高的原因:

1. 交互逻辑可能非常复杂,无法有效地用GUI语言表达

2. 无法有效遍历所有场景

3. 用户菜单写太长了用户也不好找

传统上,这部分需求可以用脚本或者说命令行工具+管道的方式有效解决。但不是所有人都能接受命令行的交互方式。

可以认为自然语言是高层次的命令行工具。

AI有可能将自然语言有效地转换为低层次的原子操作,解决一大部分长尾需求(其实已经有能力输出一些代码,差的就是执行和去掉危险操作):

3. 这个文件夹下的图片给我统一加上后缀

4. 给我看一下系统中有没有一个名叫xxx的进程,它的内存占用是多少

5. 是不是有进程内存占用太多了?

6. 把我这周的日程中跟xxx相关的给我列一下

7. 优盘帮我格式化成ext4格式(我们的文管不支持这个格式,但底层能力具备)mkfs.ext4 /dev/sda1

8. 5秒后帮我拍张照(我们的系统有摄像头但是还没的拍照应用)sleep 5; -now;

9. 5秒后给我的桌面截个图(可能我们没有自定义延时截图功能?)

10. 桌面录个视频不要声音

12. 明天6点提醒我找xxx聊一下yy的事情(sleep xxx; -t “找xxx聊一下yy事情”)

13. 插电源后永不关屏(应该是调某个Dbus服务设置个选项)

14. 把照片按时间顺序归类,每周放一个文件夹(应该10行脚本就能解决)

15. 帮我看着点电脑电量,还能用20分钟时提醒我充电。

16. 帮我看看这两张图、两个文件有啥区别?diff 1.txt 2.txt

chat gpt具备短小功能的编码能力,我们需要加强:

1. 增加执行能力

2. 去掉危险操作(rm -rf /*)

3. 增加专业领域的训练

4. () 增加通过标准UI界面展示的能力,如提供多个选择、通过图片或文本或图标展示,提供按钮确认等。

用户记不住一个程序的大部分功能,UI界面也无法显示大部分程序员可以提供的功能。这些长尾需求就通过自然语言指令来执行吧。对比 line,我称之为 line。

你甚至可以写自然语言脚本,把常用的功能记下来,用的时候点一下。

相册整理

大量的截图、视频;工作场景、生活场景、旅游场景、收藏美图;堆满了我的。每次想要整理,但是3w+照片整理不了几百张就累了,下次又得重头开始。

能不能自动帮我自动整理下照片,碰到不确定的就问我怎么处理?

目前用顶着;外加时不时一下。

我愿意为这个付费,但是目前市场上没有找到特别好用的。

一刻相册(百度出的)

323AI导航网发布

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...