Jeffery Kaneda　金田達也 @JefferyTatsuya Twitter profile

Last Seen Profiles

@NathanPurvis

@NFTswapmeet

@BILLGREENBLATT

@SubChalta_hai

@huntingva

@Stevewelds1

@SkyBetLeagueTwo

@zuo_da43409

@vvHeino

@BinorRaja

@OnudiVenezuela

@DBHGaming

@coRFaxXpkQ7645

@nextrobotics

@SavingSessions

@HuskyTrent

@nqqv7

@lovwonki_

@1LanePH

@GilbaneBuilding

@Shelby61240360

@Amaterasunofc

@heatpolicyrich

@cantstop_bam

@sclcldv

@AVFCJoshuaa

@gontabbx_ov

@_Ni0929

@shiroi_kumada

@tru_law

@AfrikParliament

@GMASynergy

@joey_masloski

@LolaDeclet

@TafaraJosephine

@yamanokuchi33

Jeffery Kaneda　金田達也

@JefferyTatsuya

2 months

一种玩法让老照片变成视频，还真的是挺让人感动的

62

506

2K

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

开源AI语音合成技术巅峰之作—— #Bark ，确实惊艳！ 🎙️极具真实感的多种嗓音 🎶音乐与人声的完美歌唱 🌟丰富的背景噪音和音效 🔊精准复制真实人声 😆非语言交流：笑声、叹息和哭泣 🌍多种外语口音 🎧来体验下效果： #TTS #opensource #AI #voiceclone

87

452

1K

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

AI代理人已经出现四星期，进入井喷状态，现在的一系列进展已经很惊人： 🌐快速建立自定义网站 💻编写SQL语句 📝完成待办事项 🔍进行研究和市场调研 💰调研销售前景 📊分析产品和股票市场数据 🤖编写和测试Python脚本 🎙️准备播客大纲 💪自主学习和改进请看具体的项目如下： #AutoGPT

90

471

1K

Jeffery Kaneda　金田達也

@JefferyTatsuya

11 months

如果你手机里安装了 #FeloTranslator ，带上任何耳机，就能从里面听到对面外国朋友说话的母语同声传译，就只有5秒钟的延迟。跟下面的视频一样（英->中）。你会有需要吗？ #AI 同声传译

36

397

1K

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

要编写优质的prompt，从日常实践来看，用下述结构，并且提出非常具体的要求，则基本可以让LLM输出你想要的结果 ✅ 角色、技能、个性 ✅ 目标 ✅ 具体的上下文、关键词、负面词 ✅ 输入规则 ✅ 输出规则 ✅ 输入输出的例子附图是两个优秀的Prompt：AutoGPT核心指令+小红书写手。都覆盖了框架的大部分

93

472

1K

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 month

我日常最常用的，按用途分类的8个实用AI工具应用开发 → "Dify" 最准确的AI搜索引擎 → "" 设计 → "Canva" 聊天机器人 → "Coze" 网站创建 → "" 一体化工作空间 → "Notion" 思维导图 → "Mapify" 信息总结和网站翻译 → ""

11

324

1K

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

如果你是认真的AI开发人员，除了OpenAI，一定要全力押注Llama2。我相信它们两个是未来的主要玩家，就像智能手机只有 iOS和Android两个系统一样。我们来盘点一下 Llama 2在7月19号发布以后，它的生态的光速完备的进展。选择下面的13个重要事件按时间倒排，可以看到它进展有多快：

31

305

1K

Jeffery Kaneda　金田達也

@JefferyTatsuya

9 months

如果你会写些Python甚至不会编码，现在用GPT-4 Vision + Streamlit 配合，也能编写很高质量的app。这篇文章列出了7个应用场景，给我们很强大的方法来快速搭建应用。

23

326

1K

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

使用大型语言模型（LLM）最让人头疼的就是学习Prompt，台湾有趣地将这样的职业译为“AI咒语咏唱师”。然而，每个人如果想要更好地使用AI，都应该学习一下Prompt的使用技巧。以下，我为大��推荐几个常见的Prompt库和教程，供大家参考。

55

394

980

Jeffery Kaneda　金田達也

@JefferyTatsuya

11 months

大家已经在疯狂试用 GPT-4V 的图像识别能力，为它的强大的能力而惊叹。请看下面这些网友的发现，感觉又一个巨大的领域被OpenAI打开。 #GPT4V #GPT4

35

302

945

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

#AutoGPT 最近大火，有几个产品大家可以体验：【最复杂】安装开源代码运行在本地【需要Token】功能也比较简单【最推荐】无需Token，功能强，任务分类很清晰附上作者 @SullyOmarr 的demo视频:

36

234

718

Jeffery Kaneda　金田達也

@JefferyTatsuya

8 months

🚀 前端代码自动生成的时代来临！ Vercel v0已向所有人开放。现在，每个人都能通过文本或图像生成代码化的用户界面。来看看大家发现的惊人使用方式！链接：

v0 by Vercel

Generate UI with simple text prompts. Copy, paste, ship.

v0.dev

16

213

712

Jeffery Kaneda　金田達也

@JefferyTatsuya

8 months

联合国开大会的时候，各国领导人带着个耳机听着后台的同声传译官们的翻译。现在Felo Translator app让每个人都可以拥有这种同声传译官。只要iPhone + AirPod耳机搭配就行。听国际大会演讲，看外语电影，留学生上课时，打开app，戴上耳机就可以听到你母语的同声传译了。眼睛可以一直看着演讲者。

39

221

674

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

近期 AI 开源社区的创新每天都涌现出惊人的成果。前天最引人注目的是 miniGPT4，据说其图像识别功能几乎可以媲美 GPT4： ✍️ 仅凭简单的手绘草图，就能生成一个完整的网站 📷 基于产品照片，可以自动生成广告口号 🍜 基于一碗拉面，可以自动生成菜谱和制作过程 🌿 基于植物叶子，还能识别出植物的病症

23

186

646

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

今天，我们迈向打破语言隔阂的新里程碑。我们自豪地推出了 #Felo 同声传译 App，您的可靠的 #同声传译助手当您与外国人面对面交谈时，它能提供： 🔄 双向翻译 ⚡ 准确实时 🌍 9种语言 🔊 语音/📝 文字翻译选项请观看效果视频🎥，欢迎大家使用并提供反馈👍。我们期待听到您的声音！ #buildinpublic

62

195

630

Jeffery Kaneda　金田達也

@JefferyTatsuya

5 months

工作非常忙，但不想错过AI的进展怎么办？建议周末找个时间，过一遍如下这些账号，绝对不会错过：宝玉 @dotey ：技术和行业小互 @imxiaohu : 新产品新技术，非常易懂歸藏 @op7418 ：行业图片视频类 Will @FinanceYF5 ：行业数据一目了然 Bindu @bindureddy 九原客 @9hills ：行业深入洞察

19

182

579

Jeffery Kaneda　金田達也

@JefferyTatsuya

9 months

这个开源项目太酷了，使用白板 + GPT-4V，每个人都是前端工程师： 1. 在白板画出UI原型图 2. 点击按钮生成网页html 3. 继续在网页上输入自然语言的调整要求 4. 可以持续修正生成的页面！能够持续编辑，是一个非常重要的能力，让AI生成变得实用！

13

173

539

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

通过看YouTube视频轻松多了🎉 为了跟上AI的进展，要花很多时间去看优秀的YouTube视频。但有时很累，听英语看字幕非常疲劳😓。用这个软件转成母语后，就轻松多了😌。这是NeuralLink获批的新闻。视频源文件： … 可以对比一下

35

201

512

Jeffery Kaneda　金田達也

@JefferyTatsuya

8 months

很多人知道Google Gemini，但觉得质量不如ChatGPT，不知道怎么使用。但Gemini是免费的，不用很可惜。现在可以通过Glarity来释放Gemini，瞬间让这个免费资源一下派上用场了。看下面视频： 1. 在Glarity设置页里，按引导，轻松点击几下就可以配置Gemini模式 2. 视频和搜索的总结很不错 #Gemini

10

149

510

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

#CoderAgent 看来在最快成熟它是软件工程的未来。10倍的效率提升让每位工程师变为架构师总结推荐： - GPT-engineer，AI编程助手，实现一键生成代码库 - GPT-Migrate，代码语言或框架的迁移 - Smol-developer，初级开发者，全方位合成以人为本的程序 - Boxy，理解你的项目，快速生成并重构代码。

16

189

469

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

🎉大语言模型的安卓时刻真的来了啊!? 这次又是微软！微软研究院的发布了 🐳 #Orca 模型： 13B参数，能力达到了ChatGPT-3.5的水平，甚至超越了Vicuna 113%! 尽管与GPT-4相比还有一定的差距，但它已经足够强大，足以应对工作中的需求了！请看下面的效果图！论文：

15

125

465

Jeffery Kaneda　金田達也

@JefferyTatsuya

10 months

快近十位朋友都跟我提，要投入到DALL·E 3，说Midjourney有点悬了😂 为啥这么火爆？ 🌟 不再需要写那种神奇咒语式的提示，完全懂你说的自然语言，还支持中文！ 🌟 绘制文本超准确 🌟 前后呈现都能保持统一 🌟 还和ChatGPT结合了，用户量巨大！接下来，让我们一起看DALL·E 3有多厉害：

17

132

459

Jeffery Kaneda　金田達也

@JefferyTatsuya

7 months

现在有哪些顶级的开源TTS模型？整理一下我收集到的。有没有补充？ 🔊 XTTS - 🗣️ YourTTS - 🚀 FastSpeech2 - 🎵 VITS - 🐢 TorToiSe - (1/3)

GitHub - neonbjb/tortoise-tts: A multi-voice TTS system trained with an emphasis on quality

A multi-voice TTS system trained with an emphasis on quality - neonbjb/tortoise-tts

github.com

24

141

447

Jeffery Kaneda　金田達也

@JefferyTatsuya

9 months

OpenAI + Zapier 已经可以定制企业的各种工作流Agent了。 OpenAI的GPT，配合上Actions和Zapier，可以自动化处理超过1000个应用程序上的工作。以下是来自 @rowancheung 将Action添加到定制GPT的高级教程：

15

132

444

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

AI的又一个大创新，AI Agent的时代来了。ChatGPT是一个被动回答问题的AI，而Agent是一个带有目标和使命，并不知疲倦的去推演任务、排优先级并执行，直至使命达成的AI。想象一下黑客帝国里执著的Agent Smith就知道了。企业各行各业的AI员工、个人的助理、政府各岗位等将都是这些个Agent来操持(1/n)

23

138

409

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

对我而言，推特无疑是获取AI知识的理想之地。众多的Twitter朋友分享出的内容让我获益匪浅。在这里，我推荐几位。有如下特点： 🔄 坚持分享有价值的内容； 📝 内容大多为原创； 🚀 思想深刻、视野宽广供参考 @dotey @DrJimFan @1littlecoder @fi56622380 @vista8 @mreflow @goldengrape luicdateAI

12

162

408

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

🔥Llama 2运行在本地！🔥 已经可以在支持GPU的MacBook上运行Llama 2了！代码链接：使用的是这个版本，在M2 Max上大概20-25个token/s。

llama-2-13b-chat.ggmlv3.q4_0.bin · TheBloke/Llama-2-13B-chat-GGML at main

huggingface.co

13

114

415

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

理论上最接近ChatGPT的模型，终于有人训练出来了， orca_mini_3b！基于OpenLLaMa-3B模型，运用WizardLM，Alpaca和Dolly-V2数据集的指导及输入，并采用Orca研究论文的数据集构建方法进行训练。训练过程在8个A100(80G)GPU上进行，约需4小时，费用为48美元。快去试试！

pankajmathur/orca_mini_3b · Hugging Face

huggingface.co

22

122

396

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

AI可以像人一样，控制浏览器和其他软件了。他们可以： 📅 管理日历和会议 🔍 在线查找信息 📧 处理电子邮件 ✈️ 预订航班和酒店 🍽 在线点餐 📚 研究复杂主题 🎬 在Netflix上搜索和播放电影 🛠 简化手动任务和复杂工具操作 📊 深入使用表格等工具等等等等... 介绍四款最新产品：

35

149

375

Jeffery Kaneda　金田達也

@JefferyTatsuya

7 months

RAG 应该是最近最火的技术之一下面是我最近看到的几个突破性进展，必看🔥： 🔎 更优的检索（ColBert） 🔄 更优的重排（ColBert） ✂️ 更优的分块（Sematic Chunking） 🧮 更优的嵌入（long Monarch） 🗣️ 更优的提示生成（DSPy） 🌟 更优的few shot（metadata RAG） 📊 更优的表格问答（Pandas,SQL）

14

108

399

Jeffery Kaneda　金田達也

@JefferyTatsuya

4 months

太震撼了，我感觉现在所有人都能进行fine-tune了！🌟 @monsterapis 已经把fine-tuning的技术门槛降到了前所未有的低度。现在你不需要任何编程知识就可以操作！他们的GPT，通过简单的对话就能完成以下步骤： 1️⃣ 找到最适合你任务的数据集 2️⃣ 指定模型和参数，启动微调过程

Santiago

@svpino

4 months

You can now fine-tune Llama 3 without writing a single line of code! We are moving at breakneck speed. I recorded a video to show you how to fine-tune any open-source model in a few minutes. I'm using a GPT capable of taking a problem and turning it into a fine-tuned model

27

288

2K

7

99

366

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

对于刚刚发布的 #Glarity 2.0，大家对PDF总结功能呼声最高！确实，我也特别喜欢PDF总结这个功能。快速总结PDF，通过Q&A高效的掌握关键信息，真的太轻松了。我现在查阅一本书里的资料，就容易多了。直接问Glarity就可以了。新功能肯定有很多不足的地方，有遇到什么什么问题在这里回复我就好。

19

102

337

Jeffery Kaneda　金田達也

@JefferyTatsuya

9 months

好爽啊, 团队把side-by-side翻译的性能调到极致🚀, 并且支持流式输出🌊, 阅读外语推特感觉无比舒畅！（效果见视频🎥）再加上大语言模型的高品质翻译能力🔝, 全程用母语阅读, 效率杠杠的💪！ #LLM #buildinpublic

9

101

344

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

#吴恩达大师和 #OpenAI 的 Isa Fulford 的新教程 Build system with #ChatGPT API 出来了。这是非常优秀的教程。有用户利用配上中文，让大家看的更加的轻松。下面每个视频的总结来自插件

Glarity - Free ChatGPT YouTube Summary/Translate Webpage Extension - Your AI Copilot

Glarity is a free ChatGPT extension that uses ChatGPT4o AI to summarize YouTube videos and translate web pages. It also supports GPT-4o, Claude 3.5, and Gemini for AI chat, video summaries, AI...

glarity.app

17

111

326

Jeffery Kaneda　金田達也

@JefferyTatsuya

9 months

这几天，Stable Video Diffusion引发了广泛关注，在图像到视频的转换方面，可能将开创全新的领域。使用者们普遍给出了以下评价：惊人！开启新世界令人赞叹如同魔法般的转换让我们来看看大家通过 #SVD 创造的一些例子：

18

60

323

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

其实AI代理之间已经能实现协作了 🎲 他们可以一起下棋 💬 通过CAMEL进行心灵探索 📈💻 AI股票交易员和AI程序员共同开发交易机器人 🎯 MultiGPT能自动组建团队，共同完成任务如果AI代理自己形成一个网络或者社会，会不会发展出自己的独特的文明和文化？

20

106

310

Jeffery Kaneda　金田達也

@JefferyTatsuya

9 months

在科技行业，阅读英文资料📘实在太重要了。但外语阅读总是低效率的 🌟 的解决方案我认为是最好的 1️⃣ 最舒服，因为side-by-side阅读距离最近 2️⃣ 最精确，因为用大语言模型来做翻译，杀鸡用牛刀 3️⃣ 最快速，因为用流式输出，看着就舒服 4️⃣ 最合算，因为借用ChatGPT，所以免费

10

84

322

Jeffery Kaneda　金田達也

@JefferyTatsuya

7 months

分享一个新的趋势随着Whisper变得更加精确，本地化成本降低，语音输入将成为主流。 🗣️ 相比键盘输入，语音输入更加自然，无需担心口语中的嗯、啊等词汇，因为LLM（大型语言模型）会进行相应的纠正。 📢 原本习惯的键盘输入逐渐成为了限制他们速度的瓶颈。 👨‍💻 现在连编程也能通过语音完成

12

73

324

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

这是非常高级的Prompt技巧，CoT（思考链）的实际例子和详细解析。普通Prompt和CoT Prompt，往往带来倍级的成果提升。比如说 Vicuna就是复制prompt来训练，而Orca使用CoT Prompt训练。后者就拥有了因果判断和推理能力。

宝玉

@dotey

1 year

是时候公布这道题的答案了。正好分享一下我最近学习Prompt的一点心得：给GPTs时间思考。这是OpenAI官方公布《GPT最佳实践》的一个章节“Give GPTs time to "think"”：。道理很简单，就是CoT（Chain of Though）那一套，不直接给答案，而是“思考”中间过程。

45

218

710

8

108

311

Jeffery Kaneda　金田達也

@JefferyTatsuya

6 months

这是最近开源界一个重大的进展穷人自己的GPT4 ：LoRA Land！ 🌀 基于Mistral微调出25个LoRA模型 🎯 每个模型完成特定任务，都优于GPT4 💲 每个模型成本8美金 🖥️ 所有模型同时运行在一张A100上(LoRAX) 完全就是MoE“混合专家模型”，成本极低，能力不差于GPT4！

LoRA Land: Fine-Tuned Open-Source LLMs that Outperform GPT-4 - Predibase

LoRA Land is a collection of 25+ fine-tuned Mistral-7b models that outperform GPT-4 in task-specific applications. This collection of fine-tuned OSS models offers a blueprint for teams seeking to...

predibase.com

7

68

300

Jeffery Kaneda　金田達也

@JefferyTatsuya

24 days

Felo的免费版，比Perplexity的付费版准确度还高。因为我们认为：准确的获得全球全网信息，是每个人的权利。不应该拿来卖钱。大家放开用

Felo - Your Free AI Search Engine

The multilingual AI search engine optimized for discovering and understanding world knowledge. Leverage the power of ChatGPT and AI Agent to break language barriers and access global information with...

felo.ai

Simon

@YRSM_Simon

1 month

用免费打付费，还打赢了？几个月的辛勤努力，数十个迭代版本，我们终于迎来了重大进展！🎉 在多语言测试用例中，Felo Search 的免费版准确率超过了行业领先的付费产品！！这是对团队付出的最好回报。激动地与大家分享这个消息，并求转发！🚀 还在等什么？点我来体验吧：

33

43

222

13

82

303

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 month

是跨语言的AI搜索引擎，可以用您的母语检索全球资料。（再小的语种也行）昨天刚上一个小功能，如果打开“增强搜索”，检索到的外语网页，都会以用户的母语来显示。

10

87

295

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

一直鼓吹元宇宙的Meta，不知不觉变成AI时代的开源清流，成为对抗OpenAI这个巨龙的少年。可以看看Meta的开源的项目： - LLama：最核心的开源大语言模型。很可能在它的衍生项目里诞生出能够对标ChatGPT的项目 - SAM：自动分割图像中的实体，计算机视觉的ChatGPT - Dino : 自监督学习的顶尖视觉模型

14

82

273

Jeffery Kaneda　金田達也

@JefferyTatsuya

8 months

开源模型发展非常快，其中一个趋势是“天下武功、唯快不破”！很多模型被改得小很多，而性能却能提示10倍以上： 🚀1️⃣ StreamDiffusion: 在GPU上以100fps生成图像，每张图像只需10毫秒。 📉2️⃣ EfficientSAM: 参数减少20倍，运行速度提升20倍，性能几乎不变（44.4 AP对比46.5 AP）。

6

64

272

Jeffery Kaneda　金田達也

@JefferyTatsuya

4 months

📚 看到一些个人知识库产品，基本都是本地LLM + RAG。不过这个reor有个特性很有意思：当你在撰写新的笔记时可以显示从语料库中"检索"到的相关的笔记。这是一种通过将当前笔记中的想法与语料库中的相关想法进行交叉参考来"增强"用户的思维的强大方式。 🔗

GitHub - reorproject/reor: Private & local AI personal knowledge management app.

Private & local AI personal knowledge management app. - reorproject/reor

github.com

7

58

272

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

我们采用AI技术的同声传译产品 Felo Translator 推出了一个全新功能：RRT。这是我们首创的二次翻译的技术，我们给这个技术方案命名为RRT（Real-time ReWrite Translate）它兼顾同声传译对翻译速度需求和翻译准确性的要求。简单的说就是一句话我们翻译两次：先快速直译，再结合上下文深度翻译。

27

65

263

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

Meta AI真不错！刚推出Voicebox是一款全能的生成式语音模型。 🌐 支持6种语言合成语音 🛠️ 通用模型，可执行未经训练的任务，如噪声去除、内容编辑、风格转换等操作 ⏱️ 仅需2秒样本，即可进行风格合成 🌍 跨语种风格转移 ⚡️ 速度是当前模型的20倍现在就来听听Zuck声音的介绍吧！

6

89

263

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

【#口音克星三分钟学会去除你的英语口音】如果你的英语水平还不错，但仍然有口音，而你想录制自己配音的英文视频，看下我制作的三分钟教程，快速去掉口音，让你能够用完美的英语为自己的视频配音。你也可以成为英语口语达人！ #英语流利如母语 🗣️👍 #elevenlabs #accent #ai #EnglishLanguage

2

57

247

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

【Felo 实时翻译】诞生一个月啦！已经获得超50个国家及地区，超4万用户的使用和推荐。我们全球首创的RRT（Real-time ReWrite Translate），得到了众多用户的赞赏。产品的进步离不开用户的宝贵反馈，因此我们会继续努力地更新迭代，让产品更加完善和易于使用。

15

61

244

Jeffery Kaneda　金田達也

@JefferyTatsuya

11 months

Felo Subtitle浏览器插件（V1.1.1）越来越好用了！ 1. 译文实时出现 2. 可以变成半透明的浮窗，拖动到任意位置 3. YouTube视频全屏，也能轻松看到字幕和译文确实适合我看日语英语的直播视频呀！链接：

12

85

246

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

你知道吗，Felo实时翻译是可以在Mac电脑上运行的。 Mac 的AppStore搜索“Felo”就能找到。当然，Felo 实时翻译的Mac版本也支持RTT功能，翻译的结果能联系上下文，这样参加多语言会议时，能更准确的抓取到客户的需求上次的调查，大家对于去噪功能呼声很高，团队正在出解决方法大家还遇到什么问题呢

14

88

241

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

如果你对AI Agent感兴趣，强烈推荐这篇文章： @lilianweng Lilian Weng 的这篇 Blog 可以说是目前 AI Agent 领域优质论文的系统综述，她将 Agents 定义为 LLM、记忆（Memory）、任务规划（Planning Skills）以及工具使用（Tool Use）的集合，

5

75

231

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

如果你要一个完全开源的多模态大模型，LLaVA + Llama 2的组合的品质已经非常高了！测试链接：我做了几个测试 🔤 文字识别 🚶‍♂️ 人物做什么 👤 人物是谁 🐾 有哪些动物 🐺 动物状态辨识 🌆 城市/风景识别效果都不错！不过非英语的识别应该还有待改进

Haotian Liu

@imhaotian

1 year

🧵1/ Exciting news! We've just released a major update for LLaVA, our open-source large multimodal model, with support for LLaMA-2, LoRA training with academia GPUs, higher resolution (336x336), 4-/8- inference, and more! 🚀🌋

19

109

515

2

75

231

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

🔥 开源进展真快！又卷到金融行业了！🚀 #FinGPT 是类似BloomBerg的开源方案。它的特点： 🎯 以数据为中心 🔬 采用RLHF和Lora的低秩技术，让新数据的训练变得又快又便宜 📚 可以内嵌商业和开源的LLM，后者就支持独立部署 💼 应用层用prompt engineer做分析师和交易员

14

95

225

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

这个工具很棒，直接生成AI QRCode。附上我的CircleO个人空间的QR Code。 CircleO里，可以预约会议、开会、闲聊、随意布置自己的空间。

向阳乔木

@vista8

1 year

@HiTw93 现在不用折腾了，刚看到一个在线工具，只需要上传二维码，写Prompt就行。

7

40

101

4

60

226

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

随着LLM的成熟，自然语言成为与计算机进行最自然的交互方式。例如： 🤖客服机器人收到客户自然语言的请求 "帮我定晚上6点的位置" 🏢企业工作流收到指令 "给一个月未活跃的用户发邮件介绍他最感兴趣的新产品" 那如何与传统软件进行对话呢？目前有以下几种能将自然语言转换为传统API调用的模型(1/N)

22

62

211

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

🎉AI的多模态时代已经来临！如今，大型语言模型让AI具备了思考的能力，以下的一些出色项目则赋予了AI感知的能力，让它能听、看、说、画画、制作视频等。它们是各种多模态Agent，可以处理文档📄、图片🖼️、音频🎵、视频🎥等，一切只需人类的一句吩咐。下面，让我们一起看看它们的精妙设计和实现👇：

25

87

202

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

来看一下编程模型（CoderLLM）🚀 LLM的子领域中，注重coding能力的是一个好切入点。竞争激烈，且优秀的模型层出不穷，各领风骚十几天。下面为您详细介绍几个模型： 🌟 StarCoder ⚡ StarCoder+ 📚 Code T5 🕰️ LTM 🧩 DIDACT 🧙‍♂️ WizardCoder 🦅 FalCoder-7B 🎯 MPT30B

10

72

185

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

大语音模型已经可以安装在一个计算器上了。以后万物都有人类级别的智能。 gpt4all 的源代码：

11

45

179

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

跟一位AI Agent 的大神聊。下图是他做的，认为创造工具是LLM 的一个顶级能力，现在看code is interpreter 就是OpenAI 在尝试实现创建工具。据说这是fine tune 以后的gpt4 才有的能力，也就是说用现有的gpt4通过prompt 是无法实现的。有哪位大神通过OpenAI 接口来实现自己版本的code interpreter?

5

67

179

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

HuggingFace上有大量的AI模型，相当于AI模型的Github。现在有人做了一个HuggingGPT，把chatgpt连到这些模型上。也就是说ChatGPT现在是人类创建的所有AI的总指挥官了。

Jim Fan

@DrJimFan

1 year

HuggingGPT is the most interesting paper I read this week. It gets very close to the "Everything App" vision that I described a while ago. ChatGPT acts as a controller over the *AI model space*, picks the right model (app) given the human specification, and assembles them

81

943

6K

2

46

172

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

新的AI产品: 面试助手，精准提词！请看面试的录屏，面试官提出了以下三个问题： - Python中生成器 - Python中内存的垃圾回收机制 - 我们为什么要雇佣你助手都出色地给了参考回复如果您希望在面试中表现优异，或者想尝鲜，请加入社区：

Owl Advisor: Enhancing Your Interview Skills | Python, Memory...

在这个录屏中，我们向您展示了一款名为Owl Advisor的软件产品。Owl Advisor是一款为面试者提供辅助提示的软件，能够帮助他们更好地回答面试问题。在录屏中，我们提出了以下三个问题，并展示了Owl Advisor如何出色地回答这些问题：请解释下Python中生成器的用法。请解释下Python中内存的垃圾...

www.youtube.com

9

58

168

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

如何在Hacker News上成功推出你的创业项目🚀 @xavier_coiffard 写的这个帖子太棒了，忍不住立刻介绍给大家，希望我们中文的创业者，也能发出优秀的Hacker News。以下是8个帮助我们在几小时内获得7000+访问量的小贴士，全文↓👇

9

54

172

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

#Bark 的collab大家可以试玩了：

Bark HuggingFace Demo.ipynb

Colaboratory notebook

colab.research.google.com

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

开源AI语音合成技术巅峰之作—— #Bark ，确实惊艳！ 🎙️极具真实感的多种嗓音 🎶音乐与人声的完美歌唱 🌟丰富的背景噪音和音效 🔊精准复制真实人声 😆非语言交流：笑声、叹息和哭泣 🌍多种外语口音 🎧来体验下效果： #TTS #opensource #AI #voiceclone

87

452

1K

4

70

160

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

Llama 2生态的进步速度真快，业界原来几个月达成的里程碑，Llama 2上几天就实现了。 Together AI带来了context为32K的模型。跟gpt4最大的模型一样大，比Claude-100K差三分之二，但是已经足够对书籍和文档的总结理解、对QA等都带来非常大的帮助。对Glarity和gptbase这都是非常重要的基础设施

Together AI

@togethercompute

1 year

We just released LLaMA-2-7B-32K, a 32K context model that can be fine-tuned for tasks like doc understanding, summarization & QA! Built with Position Interpolation & our data recipe/optimizations, run inference & fine-tune with up to 3x speedup. Thread👇

12

169

723

0

44

154

Jeffery Kaneda　金田達也

@JefferyTatsuya

4 months

作为创业者，紧跟行业技术的发展是必须的。阅读大量的论文已成为我的日常任务📚。极大地帮助我节省了时间。现在它支持： 📄打开本地PDF文件 📖对长达200,000字的论文进行总结和问答 🧮解释数学公式，非常实用 🖼️支持对截图内容进行问答来看看我的阅读论文的典型流程吧：

10

44

161

Jeffery Kaneda　金田達也

@JefferyTatsuya

10 months

Glarity能够看到收费新闻的全内容了。真的不是我们想这么干，新闻网站的程序员偷懒，直接把整个新闻内容放到HTML里，你让Glarity该读还是不读？

Simon

@YRSM_Simon

10 months

嗯，终于有办法制裁那些看了一半的网页了

0

5

15

9

41

163

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

如果把吴恩达和Open AI合作的提示工程课程用中文配音，大家是不是学习起来会更加简单。先用个女声来配音，大家听听看第一段。效果还比较粗糙，如果大家觉得需要，我们再做更多。这是完整第一段视频： #promptengineering #chatgpt #youtube #translation

20

37

155

Jeffery Kaneda　金田達也

@JefferyTatsuya

8 months

主动去搜索外语信息，并畅快地在外语资料里冲浪，一直是挺让人发憷的任务。即使英语和日语水平很高，我们也常常局限于浏览二手中文信息现在情况已经不同，看视频里，可以轻松无压力地获取外语的第一手信息： 1️⃣ 用母语关键词进行Google搜索“纽约本地人爱去餐厅” 2️⃣ 向下滚动，点击“用英语搜索”的按钮

4

49

164

Jeffery Kaneda　金田達也

@JefferyTatsuya

8 months

我一直认为LLM的大局已定，跟移动互联网是iOS + Android的闭源vs开源两个生态一样，LLM也是OpenAI + Llama的闭源 vs 开源两个生态。 Google的Gemini的视频识别功能被证明剪辑的。今天有人使用OpenAI实现了。不仅还原谷歌的演示效果，并且代码开源了：行业老大吃肉，老二喝汤

5

43

157

Jeffery Kaneda　金田達也

@JefferyTatsuya

10 months

非常认可 Will 对推特的重要价值的观点。我的AI新技术学习和产品方向的思考，绝大多数来自于推特但是有人说困难： 1. 大量外语文章 2. 内容非常多 3. 很多洞见在评论里怎么办？阅读助手责无旁贷的适配了推特 1. 推文总结 2. 用母语读 3. 包括精彩评论！各种总结请看

Will

@FinanceYF5

11 months

为什么关注AI的人应该使用推特早上和一个2b方向投资人交流。他给我第一印象非常沉稳成熟，一问是做过大厂战投，现在是自有基金做投资。但他认为GPT热度下降，感觉AI最近没什么意思，希望我推荐一些好的创业方向，或者有趣的产品。我问了下，这个很明显，你的信息渠道有问题，关注的深度不够深。

30

159

543

13

53

153

Jeffery Kaneda　金田達也

@JefferyTatsuya

6 months

大语言模型还没完，大世界模型就来了...

GitHub - LargeWorldModel/LWM

Contribute to LargeWorldModel/LWM development by creating an account on GitHub.

github.com

5

42

151

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

推荐阅读这篇文章，写得很贴近AI发展的真实情况。流动的硅谷：AI大潮、大厂探秘及华人国际化其中一个观点“fine tune不如GPT-4 search-retrieval”我也非常认可。如果工作中直接用模型，或者fine-tune行业模型，幻觉问题会是致命的。外置的一个知识库，是核心的解决方法

5

40

139

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

MetaAI的MMS 模型在HF的demo地址： 🌍 支持超过1,000种语言。 🎙️ 1,107种语言的多语种自动语音识别模型、语音合成模型 🔍 4,017种语言的语种识别模型。 📉与Whisper相比，词错误率减少了一半以上。🔥 做音视频处理可能绕不过去 Demo Docs

MMS

huggingface.co

3

37

131

Jeffery Kaneda　金田達也

@JefferyTatsuya

8 months

ChatGPT由于LLM的原理，只能回答文字。但工作中，一般有很多带图片的文档，希望喂给ChatGPT，然后回答里能带上这些图片。现在支持了！ 1️⃣上传给它一个PDF或者word文档，里面有图片 2️⃣针对资料内容提问，答案保留了文档里图文混排的回复🎉 #buildinpublic demo视频：

13

38

140

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

超过6万用户选择了生产力工具 #Glarity ，帮助这么多人提高了工作效率，非常荣幸！根据大家的吐槽和反馈，我们上线了2.0版本🚀 ✅ 增加了用户呼声最高的追问功能（Summary chat） ✅ 支持总结PDF文件（PDF support） 🔗 大家有什么希望添加的功能或是不爽的地方，随时评论💬

12

41

133

Jeffery Kaneda　金田達也

@JefferyTatsuya

4 months

非常犀利的观点： AI无法取代你的专长，但能弥补你的短板

Ethan Mollick

@emollick

4 months

If AI really does plateau at 60-80th percentile of human ability (no sign it will/won't), the impacts may be stabilizing. Whatever you are best at (often what you enjoy most), you are likely to be better than an AI, but whatever you are not good at, AI can help fill in the gaps.

54

123

820

8

44

135

Jeffery Kaneda　金田達也

@JefferyTatsuya

4 months

🌟 Surya这个OCR项目已经获得5.9K星，推荐！ ✅ 识别文字 📍 文本位置 📐 布局 🔢 顺序等功能。 🌍 对小语种的识别也表现出色。

Akshay 🚀

@akshay_pachaar

4 months

Looking for an open source OCR solution, try Surya! Surya is a document OCR toolkit that does: - OCR in 90+ languages - Line-level text detection in any language - Reading order detection - Layout analysis (table, image, header, etc detection) Pretty much everything you need

39

335

2K

5

41

138

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

✨随着越来越多大语言模型的出现，有必要对他们进行客观的评分。现在有三个榜单开始做他们的评分。列下来供大家交叉比较 • 🦙 LMSYS ChatBot Arena：市面上最主流的几个LLM的比较 • 😊 HuggingFace Open LLM：开源LLM的比较 • 🏆 SuperClue：LLM的中文能力的比较

8

51

129

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

OpenAI推出的函数调用(function calling)功能其实是一个巨大的创新。它面向开发者，技术性强，但所有从业者都应理解。下面我们深入浅出地解释它的原理和能力。从本质上讲，对于LLM的开发者，这就像是为ChatGPT加上了插件。这让工程师为大脑加上了手脚，增加了它可以做的事情。后面有具体例子：

6

32

126

Jeffery Kaneda　金田達也

@JefferyTatsuya

4 months

[优质AI开源推荐]Vanna 🌟6.6k 构建ChatBI，表现出色。主要特点包括： 🎯 针对复杂数据库的高精度回答 🔒 安全且保障隐私 🗄️ 支持任何SQL数据库 🧠 自学习功能强大

6

39

129

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

这两周有几个人已经独立实现了Agent @yoheinakajima 实现了"Baby AGI” 一个任务驱动的自治Agent, 105 lines of code. 并开源了

3

21

113

Jeffery Kaneda　金田達也

@JefferyTatsuya

10 months

研发同事对模型的评价： OpenAI原来几个模型让人很难受： Turbo3.5智力水平比较低，Prompt非常难调 GPT4质量很好，但速度太慢费用太高 Turbo3.5-Instruct 要取代Davinci，但质量还不如Davinci 这次GPT4-Turbo取得一个很好的平衡，质量比Turbo3.5好，速度一样快，价格比GPT4便宜很多，挺看好这个模型

3

26

117

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

一个"图文并茂"的ChatGPT应该是趋势很多用户觉得ChatGPT只返回文本，很多时候不能够满足需求所以上周我们上线了支持富媒体回答的Bot。在训练的时候，给它增加图片、视频等富文本内容。当被问到的对应问题时，可以把图片视频等展现给用户这应该是行业内第一个支持视频

10

32

111

Jeffery Kaneda　金田達也

@JefferyTatsuya

4 months

人机全语音对话，带感情、几乎无延迟。听起来聊天很好玩。听起来真不错。作者刚分享到Reddit

From the ChatGPT community on Reddit: WOW THIS IS WEIRD! - Speech-to-speech Emotional Chatbot

Explore this post and more from the ChatGPT community

www.reddit.com

2

27

115

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 month

【冷知识】很多人用搜索引擎只是为了找网站链接！比如，输入“大众点评”就是为了直接访问那个网站。 Felo Search 重新设计了这个功能，更加快捷。输入“大众点评”，无需回车，自动补全并弹出链接。又少了一个使用传统搜索引擎的理由啦！ 🔗

23

17

117

Jeffery Kaneda　金田達也

@JefferyTatsuya

7 months

写了一篇文章全面剖析了在检索增强生成（RAG）技术中的革新成就。从双引擎网页爬虫到文档图像解析，再到意图检测和语义理解，了解是如何在人工智能领域努力满足客户需求了解如何通过其独特的技术优化

Technical Overview: Innovations and Frontiers of RAG Technology in GPTBase.ai

Discover the cutting-edge advancements in Retrieval-Augmented Generation (RAG) by GPTBase.ai. Our in-depth article delves into the latest innovations in dual-engine web crawling, enhanced document...

www.linkedin.com

4

29

115

Jeffery Kaneda　金田達也

@JefferyTatsuya

4 months

🌟【求高手】我们计划将Llama3和Whisper结合起来，打造一个达到人类母语者水平的顶尖ASR（语音识别）模型。 🔍 如果你有信心应对这个挑战，请联系我！基本思路可以参考SLAM-LLM论文：

An Embarrassingly Simple Approach for LLM with Strong ASR Capacity

In this paper, we focus on solving one of the most important tasks in the field of speech processing, i.e., automatic speech recognition (ASR), with speech foundation encoders and large language...

arxiv.org

6

28

114

Jeffery Kaneda　金田達也

@JefferyTatsuya

10 months

OpenAI开始推类似chatPDF的功能了，应该也是使用RAG的技术对文档进行问答。感觉现在ChatGpt 又生成图片，又支持embeddings ，又识别图片。一个月才20美金，简直太便宜了。整个行业，从来没有感受到这么被一家公司碾压而没有抵抗能力的感觉。

LDJ

@ldjconfirmed

10 months

Anybody else see this?

88

131

2K

11

21

113

Jeffery Kaneda　金田達也

@JefferyTatsuya

7 months

AI大事件🎉：Chrome在Android上支持WebGPU了！要求Android 12及更高版本，并且仅适用于高通和ARM GPU的设备，在Chrome 121中，WebGPU现已默认启用。如果你的手机和Chrome版本符合要求，可以通过以下页面测试模型在本地运行效果：以后大模型可以在任意设备运行了

6

34

115

Jeffery Kaneda　金田達也

@JefferyTatsuya

11 months

ChatGPT 现在可以快速查看X光片、处方或医疗报告，并回答相关问题，宛如口袋里的医生。这预示着健康领域未来的发展将更加简单、快捷并借助于AI技术。

Shubham Saboo

@Saboo_Shubham_

11 months

ChatGPT: The doctor in your pocket 🤯 ChatGPT can now look at X-rays, prescriptions, or medical reports and answer any question in a matter of seconds. Future of health talk - simple, snappy, and AI!

110

327

1K

4

25

107

Jeffery Kaneda　金田達也

@JefferyTatsuya

11 months

「Felo 实时翻译」上线了新功能，支持复制翻译的内容了！ Felo实时翻译是一款支持13种语言并且免费的同声传译iOS App。会议中，你可以将翻译的结果复制到剪切板中。会议后，可以更好的帮助你巩固会议内容，整理会议内容。大家在体验的过程中，如果遇到什么问题可以随时留言，我和团队会及时对应。

13

27

109

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

这是斯坦福团队根据论文制作的一个小社会，里面的AI agent忙着自己的事情，甚至一起发起party。下面是这个社会回放地址。我看到他们碰到会聊天，不知道聊的什么。有种看“楚门的世界 ”的感觉。不知道里面的Agent会不会有一天领悟自己在一个虚拟世界。

Ethan Mollick

@emollick

1 year

This is quite the paper! It gave 25 AI agents motivations & memory, and put them in a simulated town. Not only did they engage in complex behavior (including throwing a Valentine’s Day party) but the actions were rated more human than humans roleplaying.

369

3K

17K

10

30

103

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

OpenAI的function calling让 @LangChainAI 从单知识库问答，进化成可以多个知识库综合生成新的知识。这个原理是把所有知识库作为Tool告知OpenAI，并使其成为独立思考的agent，来判断问题里需要的多个知识，并从多个知识库里查询出来，给出综合结论。这有源代码 @hwchase17 keep up the good job!

Harrison Chase

@hwchase17

1 year

📃Document Comparison📃 There are lots of ways to ask questions about a single document, but what about when you want to compare multiple? @pelaseyed added a great cookbook showing how to do that. Uses an agent and multiple retrieval qa chains! Docs:

7

34

191

7

46

105

Jeffery Kaneda　金田達也

@JefferyTatsuya

10 months

#LLM 现在非常火，但随着 #GPT4V 的出现， #LMM （large multimodal model，多模态大模型）将成为下一个竞争的热土。总结下有哪些进展： 🤖 LLaVa: 开源的GPT4-V的竞争者 🔗 识别图片的Langchain: 图片上的RAG 🚀 MiniGPT-v2: 视觉-语言混合的任务 🎨 SEED-LLaMA: 模拟人类的看、读和想象

5

26

109

Jeffery Kaneda　金田達也

@JefferyTatsuya

1 year

招募一起触发LLM的安卓时刻的同道！📢🤝 开源技术进展到现在，看起来已经可以自己训练出对标 #ChatGPT 3.5可商用的模型了。结合下面三个技术，可能性非常高，有感兴趣的吗？ 🦙 OpenLLama：可商用的LLama代替品 ⚙️ QLoRA：底成本、快速的训练方法 🐳 Orca：递进式学习算法 #buildinpublic

10

29

105

Jeffery Kaneda　金田達也

@JefferyTatsuya

11 months

OpenAI的Function calling的fine-tuning只需10个例子，就可以保证其工作正常，没有幻觉。这个跟prompt里给几个例子（few shot）类似，但不需每次都加。这就相当于你一次性的把AI需要的工具都教它，然后他就永远记住了。以后做事也知道该用哪个工具来处理。工具是有限的。很快gpt就都掌握上万工具

Anil Chandra Naidu Matcha

@matchaman11

11 months

OpenAI fine-tuning now supports Function calling 👏 What this means ? You can now get better agent behaviours by fine-tuning on a limited set of data as small as 10 examples to start with Reduces the need for high amount of prompt tokens due to including all function