AI导航

抢走你工作的不是AI，而是掌握使用AI工具的人。降维打击最为致命：毁灭你，与你何干《三体》

Prompt工程师

应用方向	代表作品	具体表现
文字类	chagpt、brad、copilot
代码编程
办公类	office、WPS
图片类	Midjourney、Firefly
音频类
视频类
跨模态类

AIGC github相关文档汇总

基准测试

以下列出了常见的LLM基础测试类型

大型语言模型难题基准测试（Big Bench Hard，简称 BBH）
思维链（Chain of Thought，简称 CoT）
物理互动问答（Physical Interaction Question Answering，简称 PIQA）
AI2推理挑战赛（AI2 Reasoning Challenge，简称 ARC）简单版和挑战版
社会互动问答（Social Interaction Question Answering，简称 SIQA）
开放书籍问答（OpenBookQA）
大规模多任务语言理解（Massive Multitask Language Understanding，简称 MMLU）
斯坦福问答数据集第二版（Stanford Question Answering Dataset version 2，简称 SQuADv2）
八年级数学8千题（Grade School Math 8k，简称 GSM8k）
Python数学基准问题（Math Benchmark Problems for Python，简称 MBPP）
人类评估（HumanEva）

捐赠本站(Donate)

如您感觉文章有用，可扫码捐赠本站！(If the article useful, you can scan the QR code to donate))