文生图模型
蚂蚁集团、浙大和深圳大学推出的文本生3D模型:MaPa
看起来太逼真了!与传统纹理方法不同,MaPa通过文本能直接生成高分辨率、物理光照、超真实材质的3D模型,可以极大提升游戏、VR、AR、影视等行业的开发效率。经测评,在无参考图像情况下MaPa生成的模型材质、分辨率、局部细节,比TEXTure、Text2tex、Fantasia3D等模型的效果更好
https://twitter.com/i/status/1800133925328839103
MotionFollower:将一个视频中的人物动作转移到另一个视频中的人物身上
MotionFollower可以将一个视频中的运动(例如某人的跳舞动作)复制到另一个视频中的人物上,而且不改变第二个视频的背景和人物的外观。
举个例子,假设我们有两个视频:
源视频:一段风景优美的公园视频,视频中的主角是一位穿着红色衣服的女性,她正在站着没有动作。
目标视频:一段舞蹈视频,视频中的主角是一位穿着蓝色衣服的男性,他在跳舞。
使用MotionFollower,我们可以将目标视频中男性的舞蹈动作转移到源视频中女性的身上。
让图像有声音
先image-to-text,然后在text-to-audio,最后利用Stable Audio Open生成各种音效,这样就能实现图像到声音,而且能精准匹配
中国的Sora,快手的可灵
腾讯开源了利用人像照片生成视频的模型 V-Express。
腾讯开源了利用人像照片生成视频的模型 V-Express。不知道为啥,项目演示页面的视频都挂了,看不了效果。通过一系列逐步丢弃操作来平衡不同控制信号的简单方法。通过我们的方法,较弱的信号逐渐能够发挥作用,从而实现同时兼顾姿态、输入图像和音频的生成能力。
Ouroboros3D: Image-to-3D Generation
Ouroboros3D: Image-to-3D Generation via 3D-aware Recursive Diffusion.
PixVerse 上的“Magic Brush”
Stability AI 开源了 Stable Audio Open 音乐生成模型
Stability AI 开源了 Stable Audio Open 音乐生成模型:
text2audio 扩散模型
- 能够通过简单的文本提示生成最长47秒的立体声音频(44.1kHz)。
- 适用于创建鼓点、乐器片段、环境声音和拟音录音等。
- 基于transforms扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。
- 用户可以在自定义音频数据上微调模型,生成符合个人需求的音频样本。
- 例如,鼓手可以用自己录制的鼓声样本进行微调,生成新的鼓点。
与Stable Audio 的比较:与能够生成最长三分钟完整曲目的商业版Stable Audio Open不同,Stable Audio Open 专注于短音频片段和音效。
MiGPT:将小爱音箱接入 ChatGPT 和豆包,改造成专属语音助手。
让小爱音箱和其他米家智能设备能更好地理解和响应用户指令,并且还可以直接和智能家居联动!
主要功能:
- 小爱音箱可以使用 ChatGPT 等大模型来回答问题。
2.角色扮演:小爱音箱可快速切换角色,如完美伴侣或贴心闺蜜。
-
流式响应:即时响应用户的指令。
-
长短期记忆:记住与用户的对话,越聊越默契。
-
自定义 TTS:支持不同音色,提供更生动的语音反馈。
-
智能家居 Agent:根据用户心情自动调节家居环境。
GitHub:https://github.com/idootop/mi-gpt
谷歌刚刚推出了 Veo。
它是 OpenAI Sora 目前最强劲的竞争对手 🤯 您现在可以加入 LabsDotGoogle 的候补名单,尝试 Veo 新实验工具 VideoFX 中的一些功能。
Backseat AI:英雄联盟 AI 游戏伴侣
该助手能通过语音为玩家提供实时的游戏评论和建议,包括购买建议、对线策略等。
玩家可以在比赛中提出任何关于游戏的问题,并立即获得解答。
每场比赛结束后,玩家可以在赛后大厅页面查看比赛总结,包括各个玩家的表现分析。
支持多种语言,还能和玩家分成...
NVIDIA 发布全套数字人服务技术ACE
可根据音频自动生成数字人的身体、面部和姿势
ACE 利用人工智能和图形技术,使得创建具有自然外观和行为的虚拟人类变得更加容易。
现已普遍可用的NVIDIA ACE 生成式 AI 技术套件包括:
• NVIDIA Riva ASR、TTS和 NMT一用于自动语音识别、文本转语音转换和翻译 • NVIDIA Nemotron LLM一用于语言理解和上下文响应生成 • NVIDIA Audio2Face一基于音频轨道的逼真面部动画 • NVIDIA Omniverse RTX一用于实时、路径追踪的逼真皮肤和头发
新宣布的技术包括:
• NVIDIA Audio2Gesture一用于根据音频轨道生成身体姿势,即将推出,使数字人的动作和声音协调一致。
• NVIDIA Nemotron-3 4.5B—一个新的小语言模型(SLM),专为低延迟、设备端 RTX AI电脑推理而设计,,能在设备上高效运行,让数字人的回应更加迅速准确。
Omost:帮你完善绘画提示词并生成图片
简单来讲,就是实现了ChatGPT里的DALL·E 3的效果,输入简单的提示词,调用专门经过微调的LLM(LLaMA 3或Phi 3),完善成详细的提示词并生成最终的图片,效果非常好。是ControlNet作者的新作品
Animatediff 重绘
Text-to-Video Generation(Animatediff)
这个 Animatediff 重绘太好玩了。把自己变成了童年流行动画片的主角。而且跟现实结合的也很好。
Novita AI(视频生成)
阿里的那个利用一张图和提取视频中的人物姿势,合成角色动画的项目被Novita AI开源并做了API AnimateAnyone。现在可以通过他们的API直接接入合成动画了,你只需要提供一张照片+一个参考视频即可,它能够自动识别视频中的人物姿势,并将这些姿势转换为动画。
MusePose:一种用于虚拟人类生成的姿势驱动的图像到视频框架
MusePose:一种用于虚拟人类生成的姿势驱动的图像到视频框架。目前发布的模型是对Moore-AnimateAnyone进行优化后的AnimateAnyone实现。Tencent Music Entertainment团队实现。
domoai
website: http://domoai.app discord: http://discord.gg/domoai
/video Video-to-video /gen Text-to-image /animate Image-to-video /move Make your character move
Krea AI 推出一款全新的视频生成工具: Krea Video
Krea Video结合了关键帧和文本提示,它通过关键帧和文本提示生成视频,用户可以在时间轴上灵活移动和调整它们。
- 关键帧图像:关键帧图像决定特定时间范围内的视频视觉效果。
- 文本提示:文本提示用于定义视频在特定时间范围内的视频风格和内容。
Agent Hospital:是一个虚拟的AI医院
它模拟了医院中所有的真实的医疗流程,该AI医院模拟了从疾病发生到治疗与康复的整个医疗流程,包括分诊、挂号、咨询、检查、诊断、治疗和随访等环节。模拟环境中,医生代理能够在几天内完成对1万名患者的治疗,而人类医生需要两年时间才能达到类似水平。
里面的患者、护士和医生都是由 LLM 驱动的AI代理,能够自主交互,模拟出与真实医院相似的场景和流程。在一个真实的 MedQA 数据集上,进行真实的现实验证,显示其在呼吸系统疾病上的准确率达到了93.06%,为最先进水平。
评论中汇集很有价值的信息,做 workflow 的产品确实好多,总结一下:
1、dify 2、coze 3、langflow 4、flowiseai 5、aigne 6、ragflow
发现一个超棒的网页!✨喜欢听播客的伙伴看过来! 🎤Google 搞了一个叫 illuminate 的工具,可以把学术论文变成播客。 利用AI将论文内容转为两人对话的播客形式,可以当成访谈节目,通过嘉宾发言的方式了解论文内容,非常新颖且有趣。 现在处于排队阶段👇 https://illuminate.withgoogle.com
AI 开源项目推荐 Screenshot-to-code : 截屏 -> 代码
Screenshot-to-code 是一个简单的工具,可使用 AI 将屏幕截图、模型和 Figma 设计转换为干净、实用的代码。现在支持 GPT-4o!
支持技术栈: · HTML + Tailwind · React + Tailwind · Vue + Tailwind · Bootstrap · Ionic + Tailwind · SVG
支持大语言模型: · GPT-4o - Best model! · GPT-4 Turbo (Apr 2024) · GPT-4 Vision (Nov 2023) · Claude 3 Sonnet · DALL-E 3 for image generation
官网: https://screenshottocode.com Github repo: https://github.com/abi/screenshot-to-code
https://research.aimultiple.com/serverless-gpu/ (Top 10 Serverless GPUs vendor )
【图片】最可控最实用的AI生成图片:https://ideogram.ai
【音乐】AI Music的iPhone时刻:https://suno.com
【语音】最牛逼的AI语言合成,带情感识别:https://hume.ai
【搜索】个人心中最好的AI搜索产品,比perplexity强https://metaso.cn
【广告】最实用的AI脚本和创意产品:https://foreplay.co
【生产力】AI画布工具:https://flo.ing
有针对以下领域的LLM:
- 情绪 - Hume AI
- 物理传感器 - Archetype AI
- 天气预报 - Jua
- 材料科学 - Orbital Materials
- 机器人技术 - Physical Intelligence
- 生物学 - Bioptimus
- 电动车电池设计 - Chemix
- 从草图到视频 - Haiper
- 从2D到3D - Kaedim
- 工业设计 - Vizcom
- 视频安全 - Lumana
- 从文本到UI - Galileo
《动手学大模型》系列编程实践教程,由上海交通大学2024年春季《人工智能安全技术》课程(NIS3353)讲义拓展而来(教师:张倬胜)https://github.com/Lordog/dive-into-llms/
Y Combinator W24,100+ AI项目全览
AI应用 > 工具,垂直行业解决方案 > 基于工作流程提升效率的水平AI解决方案,生成式AI进一步向行业渗透。AI垂直行业解决方案聚焦医疗、金融、生物、ESG、供应链和物流、法律以及生产制造等。占比约31%,超过去年20%多的比例。
Healthcare医疗
RadMate AI RadMate AI 是一个为放射科医生服务的AI助手。随着越来越多患者获取影像检查资料,放射科医生面临着越来越多的需要快速生成详细的报告的需求。RadMate AI 通过阅读放射影像并自动生成完整报告,供放射科医生审核和提交,从而大幅减轻了他们的工作压力。
Scritch Scritch 是一个专为兽医打造的,帮助兽医开设、运营和扩展诊所服务的AI平台。通过提供智能化的工具和服务,Scritch 能够优化兽医诊所的日常运营,帮助其处理包括预约安排、账单管理及临床工作流程优化等工作。
Sonia Sonia 是一款人AI心理健康治疗师,通过手机应用程序提供语音和文本治疗会话。无论是为了寻求专业的认知行为疗法(CBT),还是需要简短的5分钟的会话来倾诉心中的烦恼,Sonia 都能在您的心理健康旅程中提供支持。
Kabilah 当前,80%的严重医疗错误发生在病人交接过程中。Kabilah的AI解决方案取代了常见的纸质报告单,在短短几秒钟内,护士就可以通过生成的摘要和与电子健康记录(EHR)数据的互动聊天来了解病人的医疗历史。
Maia Maia 是一款旨在帮助情侣增进关系的AI工具。通过与关系专家的合作,Maia 提供了一系列旨在加强情侣关系服务,包括日常活动建议、个性化建议、主动洞察、测验和游戏等。
Hemingway Hemingway 是一款专为牙科诊所设计的患者预约系统。这款 AI 工具能够通过电话和短信与患者进行沟通,并在牙科诊所的日程表上自动预约安排。
Arini Arini 是一款为牙医设计的人工智能前台接待员,可以接听电话并安排预约。
Hona Hona 与电子健康记录系统进行集成,收集并精简医疗历史记录,通过找回以往在繁杂病历中丢失的数据,使医疗服务提供者能够全面了解他们的患者。
Attunement Attunement 是一个专注于行为健康的远程监控平台。提供多模式评估和治疗建议,以帮助解决 5780 万美国人经历的心理健康危机。
Andy AI Andy是一款专为家访护士设计的人工智能软件,能够完成护理文档工作。护士们通过使用 Andy应用程序记录他们的访问情况,随后会收到由Andy直接完成的病历图表,并可直接导入到电子健康记录(EHR)系统中。原本需要90分钟的文档处理过程现在缩短为仅需15分钟。
Delve Delve是一款自动化HIPAA合规(旨在规范美国企业应如何处理敏感的健康数据)的软件,通过自动化软件基础设施搭建、流程化文件资料管理和持续的安全监测,简化合规流程。
Somn Somn打造了一个服务医院诊所的AI接诊员,它可以拨打电话给患者以预约诊疗时间,提醒他们即将到来的预约,以及在诊疗后进行跟进。Somn旨在提高医疗服务的效率和患者满意度,同时减轻医务人员的行政负担。
TrueClaim TrueClaim 处理所有医疗保健提供者与保险公司之间的支付。TrueClaim 持续审查 100% 的医疗保健发票,以检测计费错误、药品和护理节省机会。
Piramidal Piramidal 正在构建一个训练于庞大且多样化的脑电波数据语料库的基石模型,能够理解和检测大脑活动的多个方面,从疾病到健康状态。
Anaphero Anaphero 通过自动化日常但至关重要的任务来解决医疗人员短缺的问题。
Finance金融
GovernGPT GovernGPT 是一个专为机构融资服务的AI助手, 通过AI技术将尽职调查材料填写时间大幅缩短至几分钟,极大提高了融资效率。
Lucite Lucite 是一款金融生产力软件,能够生成投资银行风格的演示文稿和研究工作。
Shiboleth Shiboleth是服务金融借贷机构的AI合规工具,客户可使用Shiboleth AI来标记客户互动中的合规、违规行为,并生成合规初稿。通过这种方式,Shiboleth为贷款公司提供了一个强大的合规监控和报告工具,简化了合规流程。
Powder Powder是一款人工智能工具,旨在帮助财富顾问快速创建针对每位潜在客户的个性化销售提案。通过利用大型语言模型(LLMs),Powder能够快速分析客户投资组合相关文件资料和以往的沟通信息,并根据不同情况模拟投资回报及风险,以制定最佳服务方案。
Senso Senso打造了针对金融行业的AI客服,因为涉及的信息繁杂、政策多样、流程复杂,经验少的客服人员可能需要花费很长的时间响应用户问题,40%的用户”put on hold“,经常需要等5-7分钟。
Meticulate Meticulate 为金融专业人士提供轻松获取世界级商业研究的途径。
Model ML Model ML 为投资银行、私募股权公司和家族办公室提供基于人工智能的尽职调查工具。
OffDeal OffDeal 正在构建一个面向投资银行的AI助手,帮助投资者搜寻潜在的中小型企业收购机会。
Clarum Clarum 通过加快尽职调查的过程,帮助私募股权公司完成更多的交易。平台从丰富的内部私有数据中获得的定量洞察。
ProSights ProSights 是一款面向投资公司的客户关系管理系统,为投资公司提供了一个高效、智能化的工具,帮助他们捕捉投资机会并管理投资项目。
TokenOwl TokenOwl 是为高频交易的 DeFi 和Meme币加密货币交易者设计的人工智能 TurboTax。它让高度活跃的链上交易者能够更准确地计算税款。
Blume Benefits Blume 简化了健康保险经纪人的保险报价、续保和收入运营流程,帮助保险经纪人平均每周节省6小时的手动数据输入时间。
BioTech生物
Argon AI, Inc. Argon AI 的平台使生物制药和生命科学专业人士可以使用自然语言执行复杂且数据驱动的工作流程。
Yoneda Labs Yoneda Labs 帮助科学家在制造药物或材料时,找出最佳的反应参数,如温度、浓度和催化剂。
Junction Bioscience Junction Bioscience旨在推动药物发现领域的创新。通过分析大量的科学数据,识别出潜在的药物候选分子,并通过模拟和预测来优化这些分子的结构和功能。
Artos Artos是一款基于人工智能的文件起草平台,它协助生命科学公司将数据快速转化为监管审查文件,节省了时间和资源,提高了文件的准确性和合规性,以及通过监管机构审查的可能性,推动创新药物和医疗设备更快地进入市场。
ESG
Aidy Aidy 使用人工智能帮助初创企业和非营利组织申请政府补助金。
Hazel Hazel向每年采购额达2万亿美元的19,000个州和地方政府销售人工智能驱动的采购软件。Hazel利用大型语言模型(LLMs)加速并改进目前仍使用20年前技术的招标过程,吸引更多高质量的投标者,达成更好的招标结果。
Spark Spark是一个专为大型清洁能源开发商设计的人工智能驱动的规划和工作流程工具,它能够帮助开发商更快地破土动工。通过 Spark,开发商可以跨数千份PDF、地图和网站进行搜索,快速识别出所需的要求和地点,这一过程只需几秒钟,而不是几周时间。
Aether Energy Aether 提供了一个专为屋顶太阳能安装商设计的人工智能平台。旨在降低太阳能屋顶的安装成本。
Supply Chain & Logistics供应链&物流
Manifold Freight Manifold旨在改革承运人、经纪人和货主的现货货运流程,首款产品旨在减少空驶状态、增加收入。
RetailReady RetailReady 使用基于人工智能的应用程序取代仓库工人的纸质手册,以提高仓库的运营效率。
CommodityAI CommodityAI 使商品交易公司轻松管理他们的货物运输。美国最大的糖交易商使用我们的AI自动化平台来追踪数千次货物运输,并处理超过一百万份航运文件。
Legal法律
Leya Leya 是一款专为法律专业人士设计的AI助手,擅长回答复杂的法律问题并优化工作流程。通过对律所内部的知识库以及外部的法律法规和案例库进行整合,Leya 能够提供可靠且有来源引证的答案,为客户提供了更加高效和高质量的法律解决方案。
PointOne PointOne 使用人工智能帮助律师自动化时间跟踪和账单审查,以收集更多的收入。
Abel Abel旨在赋予律师更高效的执业能力,通过训练AI阅读众多类型的法律文档并回答关键问题,使律师可以更快地分析和理解大量法律资料。
Manufacture生产制造
Draftaid DraftAid 是第一个用于生成 CAD 制造图纸的人工智能助理,极大地缩短了图纸创作时间,将小时变为秒。
NavierAI Navier AI 旨在使用基于机器学习的求解器使计算流体动力学(CFD)的速度提高 1000 倍。
atopile atopile 是用于电路板设计的一种全新语言。用代码取代了点击式图形界面,将软件级别的自动化带入了硬件设计领域。
Others其他
HostAI HostAI旨在成为Rippling for 美国度假屋租赁市场,集成Airbnb等Listing平台,帮助客户一键管理房源和预约。目前利用AI开发了虚拟助手,自动回复消费者信息,根据空置时间完成预定,以及upsell动作。
Skygaze Skygaze打造了一个基于Bluesky的信息流产品,Bluesky对标X,Skygaze专注打造信息流推荐工具,使Bluesky用户可以根据自己的偏好掌握更多信息选择和控制权。
BetterBasket BetterBasket是一款利用数据和算法帮助杂货商进行定价的工具。创始团队曾在Uber Eats共同工作。
Lumona Lumona是一款创新的产品搜索引擎,旨在为用户提供一种全新的购物体验。与传统搜索引擎不同,Lumona 专注于从用户信任的创作者那里获取高质量的产品推荐。
Shepherd Shepherd是一个服务学校和学生的AI学习助手,结合人工智能支持的自学、辅导、同伴协作和分析功能,为学生打造一个高效的个性化学习体验。
InspectMind AI InspectMind AI 正在改变建筑建造和设计人员的流程。平台使用人工智能快速将施工现场的视频和照片转换为详细、准确且格式良好的报告。
HeyPurple Purple 是一款专为房东和物业管理公司设计的AI租赁助手。Purple能够直接根据房源列表回答潜在租户的问题,为有意租房的访客安排参观预约。通过 Purple,租赁管理变得更加智能化和自动化。
Precip Precip 利用AI技术进行本地天气观测,专注于提供精确的降雨信息。该服务的核心在于通过高度精细化的数据收集和分析,为用户提供实时、准确的降雨情况,帮助他们做出更明智的决策。
Horizontal AI|基于工作流程的效率提升(26%)
基于工作流程的效率提升工具,主要聚焦生产力工具、销售、商业智能、客服、HR和企业安全等方面。占比约26%,相比去年(40%左右)下降。
Productivity Tool生产力工具
Danswer Danswer 是一款为企业服务的AI助手,它能够连接到您公司的所有工具和文档,让查找任何信息都变得轻而易举,相当于是一款专为企业定制的GPT。
DryMerge DryMerge 是一款允许用户通过简单的英语指令来自动化工作的创新工具。想象一下,如果需要管理潜在客户,用户无需拖拽复杂的模块或编写代,而只需简单地告诉DryMerge管理指令,随后就可以在几秒钟内看到这一切自动发生。
Duckie Duckie 是一款旨在帮助工程师快速解决技术支持问题的AI助手。Duckie 通过学习知识库,为每个问题找到相关信息并生成解决方案,帮助工程师进行故障排除,并自动保持文档资料更新,将问题解决速度提高10倍。
Paradigm Paradigm 正在构建能够与现有工具和工作流程集成的人工智能代理,以自动化任务。
Artisan AI Artisan 旨在创建最先进、类似人类的数字工人。第一个产品 Ava 是 业务发展代表,自动化了整个外向销售流程。
Speck Speck 是一款人工智能助手,帮助知识工作者自动化他们重复的网络工作流程。
Creo Creo 是一个以代码为先、人工智能辅助的内部工具构建平台。
Lumina Lumina 是一个旨在自动化研究工作流程的人工智能平台,首先从文献综述开始。用户能够将原本需要数月时间的文献综述工作缩短至几秒钟,并且能够即时获得 Lumina 提供的引用报告。
Circleback Circleback通过自动编写会议总结,帮助团队充分利用每一次会议,无论是通过Zoom、Google Meet、Slack小聚还是面对面进行。这款工具旨在提高会议效率,确保团队成员能够快速回顾和执行会议中的重要信息和决策。
Alai Alai是一款AI驱动的PPT创作工具。例如,产品经理可以输入他们的提案文本,无需花费数小时在设计上,AI生成PPT。由此简化了PPT的制作过程,提高了工作效率。
Ocular AI Ocular打造了一个AI驱动的服务企业内部的知识信息检索平台,连接公司所有应用程序和工具,使团队能够搜索、可视化关键信息,提高了工作效率和信息获取的便捷性。
Basepilot Basepilot旨在创建人工智能助手,以自动化浏览器中的重复性和手工操作。例如,销售—— 自动化销售拓展、潜在客户挖掘和跟进工作;招聘—— 协助搜寻候选人,分析和分类简历;财务—— 协助填写申请表/表格、数据传输、执行会计操作等,帮助公司每周节省 30%的时间并降低成本。
Fluently Fluently打造AI语音会议助手,应用场景是在母语非英语者开会时,利用AI记录、分析并给出语言提升意见(发音、语法、专业度等)。
Patchwork Patchwork 为每个团队成员提供了一个针对个人偏好进行个性化定制的的信息流,其中包含了他们日常所需的所有更新、设计和工程讨论以及公告。
CloudCruise CloudCruise 是一款人工智能增强的机器人流程自动化(RPA)软件。
Kontractify Kontractify 为企业采购团队提供了运行和协作 RFP 的轻松体验,使用LLM来加速繁琐的流程。买家可以通过该平台建立、启动和管理所有卖家沟通。
Risotto Risotto 帮助 IT 团队提高解决问题的效率,减少 SaaS 花费,并通过 24/7 自动化软件访问和 IT 支持增强安全性。
Airfront Airfront 使用人工智能技术来自动执行邮箱中的手动任务。平台能够完全理解每封电子邮件背后的上下文,并支持智能工作流程,如回复客户、同步数据和筛选信息。
Glimmer Glimmer 提供一种使用人工智能搜索大型 PDF 文件的新方法。该方法使大型文档的搜索变得10倍高效。
Sales销售
Octolane AI Octolane AI 旨在构建AI优先的 Salesforce,不仅存储客户数据,还在数据中挖掘最佳客户。
Firebender Firebender 使用户可以对抓取的网站、工作列表、LinkedIn 发布内容等进行自然语言查询来对任何公司进行资格审查。
Centralize Centralize 是售前和售后团队了解客户的新方式。我们正在构建完美的“客户大脑”,聚合并分析跨时间、工具和利益相关者的接触点。
Openmart Openmart是新一代人工智能驱动的销售情报工具,对标ZoomInfo,帮助销售查询数百万非结构化的商业数据,如网站、评论和社交媒体信息,寻找销售线索。
Terrakotta Terrakotta是一个AI驱动的销售自动化语音工具,首先服务地产经纪人,通过声音克隆,Terrakotta可以自动帮助用户拨打潜在客户电话,在无人接听时,留下经过A/B测试的个性化语音留言,以获得回拨,提高电话营销和客户沟通的效率和成功率。
Ecliptor Ecliptor 帮助开发者工具提高用户转化率。平台通过统一并去匿名化开发者触点上的个人资料,以发现高度参与的产品倡导者。
Quantic Quantic 帮助销售人员构建更好的销售渠道。Quantic 通过研究用户业务数据,挖掘购买信号、洞察和渠道机会。
Veles Veles 是一个企业销售助手,用人工智能驱动的报价工具赋能销售人员。
Amber AI Amber 是售后团队的扩展,通过了解每位客户和每项行动的背景,提供用户体验和增值销售的机会。
Topo Topo 为B2B公司提供一个针对他们知识定制训练的人工智能销售代理来吸引正确的潜在客户。
BI & Data Analytics商业智能
Upsolve AI Upsolve AI 是一个面向客户的分析即服务平台,致力于构建一个完整的数据堆栈,使企业能够以极快的速度为其客户提供分析服务。
Buster Buster 提供链接数据库和大模型应用的基础设施平台,提供数据目录、微调、安全、评估、检索、SQL 生成等工具。
DaLMatian DaLMatian 旨在打造AI数据分析师,构建一个多步推理代理以帮助决策者增加收入。
http://Superagent.sh Superagent 帮助用户创建将数据转化为洞察的人工智能代理。
http://kater.ai Kater 是一个能够自我学习的数据分析师,可以组织、理解和记住公司数据资产的所有细微差别,挖掘数据洞察。
Intercept Intercept 帮助零售品牌自动反驳零售商和渠道商不合理的费用,回收大约 5% 的收入。
Tile Tile 是一款人工智能优先的商业分析工具,具有可视化、低代码和SQL处理等功能。
Customer Support客服
Markprompt Markprompt 正在构建人工智能基础设施,以支持大规模的客户支持服务。
Toma Toma是一款面向汽车经销商的电话自动化人工智能解决方案。通过人工智能技术,帮助经销商不再错过任何来电,同时为客户提供愉悦的体验。美国约有70,000家经销商,市场规模价值80亿美元。
http://Opencall.ai Opencall 为企业提供人工智能客服中心,能够回答问题、预订会议,并与现有软件集成。
Marr Labs Marr Labs 正在开发人类无法区分的人工智能语音代理。其代理能够接听电话、安排预约、并呼叫中心的销售和支持工作。
HR人力资源
Apriora Apriora 通过人工智能招聘助理进行实时面试。可以在几分钟内针对用户的职位进行定制,并且已经在工程、IT、零售、酒店等多个领域进行了数千次面试。
Parasale Parasale 正在打造人工智能招聘助手。它能够为用户寻找、接洽并安排候选人。
Security企业安全
Alacrity Alacrity 正在开发下一代的欺诈预防和身份验证工具,为公司提供一套多因素身份验证功能。
03 GenAI|AIGC内容生成(9%)
我们仍保留了GenAI生成式AI标签,该象限下主要是利用AI生成视频、音频、图像、游戏、3D素材以及文本的AIGC工具。占比约9%,视频和音频生成技术的突破使GenAI的占比高于去年夏天,但少于2023年上半年孵化营中GenAI项目比例。
Video视频
Magic Hour Magic Hour旨在成为专业级的视频创作工具,将人工智能视频模型集成到一个工作流程中供创作者选取最佳方案制作专业级视频内容。
Yarn Yarn 使用人工智能技术帮助创始人、销售人员和市场营销人员制作产品和销售视频。
Infinity AI Infinity 是一个从脚本到电影的基础模型。
Focal Focal 是一家人工智能电影制片厂。我们构建的工具帮助用户将书籍和剧本转换成电影。
Sync labs Sync labs 正在构建一个用于创建、修改和理解视频中的人物的基石模型。
Wuri Wuri 是一款用于阅读小说的应用程序,它将网络上的顶级故事实时转换成带有音频、图像和视频的视觉小说。
Eggnog Eggnog 是GenAI内容的 YouTube,旨在打造最大的可混合使用的角色和场景库,供用户协作构建和观看。
Audio音频
Soundry AI Soundry AI是一款将文字描述转化为高质量音频样本的音乐工具,基于独有的Foundational Latent Diffusion Transformer架构,开创音频内容生成和编辑的新领域,服务音乐制作人和爱好者。
PocketPod PocketPod打造了一款根据用户兴趣量身定制的AI生成播客。无论是日常新闻更新还是对特定主题的深入探讨,PocketPod旨在让人们以熟悉的播客形式消费信息。
Sonauto Sonauto 是一款人工智能音乐编辑器,可以将提示、歌词或旋律转换成任何风格的完整歌曲。
Aqua Voice Aqua 是一款以语音为核心的文本编辑器。能够帮用户润色措辞、填补遗漏的词汇,并理解你=用户的意图。
Image图像
SevnAI SevnAI 为企业构建平面设计的基石模型。模型可以执行复杂编辑任务。
Game游戏
Arcane Arcane打造由人工智能驱动的Roblox。第一个产品Summon Worlds,被数千人用来制作基于文本的角色扮演游戏。用户使用简单的英语构建复杂的世界,包括角色、地点、物品和故事,公司开发的Arcane引擎随后将用户的描述转化为 AI 驱动的游戏,无需编写代码。
3D素材
Ego Ego 正在构建首个由生成式人工智能驱动的仿真引擎,非技术创作者可以通过简单的提示生成由大型语言模型(LLMs)驱动的真实感角色、3D世界以及交互代码/脚本。
Text文本
HeartByte HeartByte 是一个内容平台,创作者可以在这里创作原创小说/漫画,或者基于其他虚构世界创作衍生作品。
DevAI|服务开发者的生成式AI(13%)
新增标签:DevAI,主要是指服务开发者的生成式AI工具,聚焦于搭建开发AI应用的基础设施、代码生成以及AI软件工程师3个方向。占比约13%。
Dev Infra 开发AI应用的一键基础设施
Just Words Just Words是一款利用人工智能技术为大型企业优化产品文案(例如:登陆页标题、通知信息)的工具。团队曾在Twitter 和Pinterest构建了类似的系统,成功帮助产品增长了20%用户。
Brainbase Brainbase是一款旨在处理复杂企业工作流程的AI开发者工具。客户可以基于Brainbase提供的工具快速打造从销售、客服到企业知识管理的AI应用。
Retell AI Retell AI提供构建AI智能语音助手的API开发者平台,提供自然人声、并将语音回复时间间隔缩短至800ms,支持无缝接入用户的任务场景。
Onedoc Onedoc是一个针对PDF文档工作流的API。为开发者提供了执行各种 PDF任务的能力,如生成PDF文档、填写表单、进行数字签名等。通过使用Onedoc的开源库,开发者可以构建以文档为中心的工作流程。
Dragoneye Dragoneye 提供高准确度和深度细节识别世界上的事物的模型,从而帮助开发者构建图像和视频应用。
Agentic Labs Agentic Labs 的 Glide 是专为编写技术设计文档而设计的AI编辑器。为工程团队节省了在复杂代码更改的分类、规划和实施上的时间。
Zep AI Zep 帮助人工智能代理回忆、理解和从聊天历史中提取数据,使开发者能够构建丰富、个性化的体验。
DeepNight DeepNight 利用最先进的数字CMOS传感器、高性能移动SOC和边缘人工智能处理技术,构建实时的边缘夜视能力。
Pretzel AI Pretzel 通过内置的人工智能工具、协作功能、现代化的代码编辑特性、原生 SQL 支持以及一个视觉化的、人工智能辅助的数据探索和仪表板套件来解决 Jupyter 的问题。
Edgetrace EdgeTrace 使视频数据对于关键行业变得易于获取和可用。平台和 API支持高级视频功能,如语义搜索、自动注释和分析。
Code代码
Driver AI Driver AI 是一款代码辅助AI工具,通过分析代码并生成易于理解的解释,它能在几分钟内解释复杂的代码库,帮助团队快速理解并加速技术推动,节省大量时间和资源。
Assembly Assembly 是一款代码搜索引擎,帮助开发者理解代码的工作原理和关系。
Ellipsis Ellipsis 是一款人工智能开发工具,可以将技术指令转换成可用、经过测试的代码。
CodeAnt AI CodeAnt AI 帮助公司发现并自动修复代码问题和安全漏洞。
Million.js Million 是一款可以自动让网站提速的性能监控(APM)工具。使用人工智能自动发现性能问题并编写代码来修复它们。
Greptile Greptile 是一款由人工智能驱动的 API,能够以自然语言搜索和理解大型代码库,让软件团队轻松构建强大的内部开发工具。
Leaping Leaping 能够自主地找出软件缺陷的根本原因,并生成经过测试的代码修复方案。
Software Agent AI软件工程师
ion design Ion Design 是一款创新的生产工具,通过自动化的方式将 Figma 设计转换为像素级别的、可直接投入生产的代码,大幅提高前端部署效率。
Tusk Tusk 是一款人工智能代码注意,能够完成烦人的问题票据,让软件工程师专注于更重要的工作。
Marblism Marblism提供基于OpenAI GPT模型的AI Web APP开发工具,针对专业用户—— 开发者、工程师等,覆盖从前端到后端的开发。
Fume Fume 正在构建一个能够解决复杂任务的人工智能软件开发者。
Pythagora (GPT Pilot) Pythagora 是一款通过与用户对话从头构建应用程序的开源工具。产品基于GPT Pilot构建,它在Github上拥有超过 22k 的星标。
05 Embodied AI|具身智能(2%)
Yondu Yondu 开发的模型使机器人能够理解和智能执行复杂命令。第一个产品是一架可以通过声音控制的无人机。
Pivot Robots Pivot Robots 为工业机器人臂开发了手眼协调能力,使其能够处理任何零件。
K-Scale Labs K-Scale Labs提供开源人形机器人解决方案,使任何拥有3D打印设备的用户都可以构建自己的人形机器人。
06 AIOps|开发者工具(19%)
图片 作为开发模型、AI应用,使用基石模型的工具,今年YC的AIOps主要关注编排、评估、数据、测试、部署、洞察、RAG以及安全开发方面。占比约19%,延续了去年AIOps占比持续降低的趋势。
Orchestration编排
Lantern Lantern 是一款Postgres向量数据库的拓展插件,帮助开发者构建AI应用程序。通过 Lantern Cloud,开发者可以获得构建 AI 应用程序所需的一切资源:嵌入生成、向量压缩、向量搜索、高效索引等。
AgentHub AgentHub 是一个利用AI自动化工作流程的平台。通过该平台,用户可以通过拖放和连接模块化组件到画布上来创建强大的自动化流程。AgentHub 提供了工具和基础设施,使得用户在编写、测试和生产代码方面的速度提高10倍。
OpenCopilot OpenCopilot 帮助用户在任何产品中轻松添加能够通过简单的英语命令引导和帮助用户的人工智能助手。
Crux Crux 帮助 B2B SaaS 团队在结构化数据上构建帮助决策的Copilot工具。
Keywords AI Keywords AI提供了发布和优化LLM应用的整合平台,构建了统一的接口和基础设施。
OpenFoundry OpenFoundry 是一个开源平台,帮助工程师们以10倍的速度构建、部署和扩展他们的开源人工智能技术栈。
Evaluation评估
Vectorview Vectorview 是一家专注于评估基础模型和大型语言模型(LLM)工具能力的公司。通过定制的任务评估工具,Vectorview 帮助企业和研究人员轻松评估这些模型的实际应用能力。
Phospho Phospho 是一个为部署中的LLM应用而设计的开源文本分析平台,旨在成为 LLM 操作系统的 Datadog。
Guide Labs Guide Labs 正在构建可解释的基石模型。该技术可以让模型更容易进行调试、引导和对齐。
Ragas Rages 正在为企业构建 LLM 应用程序测试和评估基础设施。
Dawn Dawn 是人工智能产品的分析平台。将用户请求和模型输出转换为用户真正关心的指标。
Data数据
Reducto Reducto为用户提供强大且可靠的文档摄取服务。通过其 API,用户可以将复杂的、非结构化的文档转换成结构化的输出,适合用于RAG、流程自动化等多种应用场景。
Roe AI Roe AI 是下一代人工智能驱动的数据仓库,用于存储、处理和查询非结构化数据,如文档、网站、图像、视频和音频。
OmniAI OmniAI 将非结构化数据转换为表格数据,让用户在现有的数据仓库内转换和增强非结构化数据变得简单。
Trellis Trellis 将用户的非结构化数据转换为 SQL 兼容的表格,从而使企业能够更有效地利用其数据资源。
Datacurve Datacurve 提供由高级软件工程师创建的专家级质量代码数据,并且能够大规模获取这些数据。
Testing测试
MAIHEM MAIHEM 是一家专注于开发AI助理的公司。这些AI助理将专门用于测试AI产品。通过 MAIHEM,企业能够自动化他们的 AI产品的QA流程,保证系统性能和可靠性。
Momentic Momentic 是一款旨在提高开发人员测试效率的工具。通过AI技术,Momentic能够自动化执行许多繁琐且耗时的测试任务,从而显著加快测试用例的编写速度。
camelQA CamelQA 利用大型语言模型(LLMs)技术,仅需移动应用的二进制文件和用自然语言表达的测试用例,即可对移动应用程序执行完整的端到端测试。
Relari Relari 帮助人工智能团队在整个开发生命周期中模拟、测试和验证复杂的 AI 应用程序。
Deployment部署
nCompass Technologies nCompass 是一个用于加速和托管开源和定制人工智能模型的平台,提供低延迟的 AI 部署。
Preloop Preloop 能够自动将您的机器学习训练脚本转换成生产服务,并处理训练流程和 REST 端点的创建。将部署时间从几周大幅缩短至几个小时或更少。
Tensorfuse Tensorfuse是一款简化用户在自己的云上部署和管理大型语言模型(LLM)管线的工具。用户只需将云连接到Tensorfuse,选择模型和数据并点击部署,Tensorfuse将自动配置和管理底层基础设施。通过这一平台,用户可以轻松地将先进的人工智能技术应用于自己的数据和业务流程,无需深入了解底层技术细节,从而节省时间,提高效率。
Observability洞察
OneGrep OneGrep 是一款人工智能可观测性工具,帮助工程师以更低成本将事故解决速度提高 10 倍。
Decipher AI Decipher AI 让工程师通过使用AI分析运行时数据和产品行为来识别和解决生产问题。
Reprompt Reprompt为生成式人工智能应用的开发者克服将应用从试点阶段扩展到生产环境的难题。提高了应用的可靠性和安全性,也为用户提供了更加丰富和个性化的体验。
RAG
Quivr Quivr 是一个开源的 RAG(检索增强生成)框架,在 Github 上拥有超过 28k 的星标,并且可以连接公司数据。
Trieve Trieve 为构建检索和 RAG(检索增强生成)的搜索团队提供基础设施。
SciPhi SciPhi 是一个云平台,它简化了开发者部署和优化生产就绪的检索增强生成(RAG)管道的过程。
捐赠本站(Donate)
如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))