句子嵌入: 交叉编码和重排序
|
|
0
|
130
|
2024 年2 月 6 日
|
全世界 LoRA 训练脚本,联合起来!
|
|
0
|
248
|
2024 年2 月 5 日
|
随机 Transformer
|
|
0
|
192
|
2024 年1 月 29 日
|
最新 Hugging Face 强化学习课程(中文版)来啦!
|
|
0
|
136
|
2024 年1 月 22 日
|
SetFitABSA: 基于 SetFit 的少样本、方面级情感分析
|
|
0
|
118
|
2024 年1 月 18 日
|
给科研人的 ML 开源发布工具包
|
|
0
|
148
|
2024 年1 月 17 日
|
开放 LLM 排行榜: 深入研究 DROP
|
|
0
|
118
|
2024 年1 月 15 日
|
Hugging Face CEO: 2024 将是AI丰收年
|
|
0
|
82
|
2024 年1 月 12 日
|
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
|
|
0
|
112
|
2024 年1 月 10 日
|
了解 Flutter 3.16 功能更新
|
|
0
|
196
|
2024 年1 月 7 日
|
Dart 3.2 更新盘点
|
|
0
|
149
|
2024 年1 月 7 日
|
非工程师指南: 训练 LLaMA 2 聊天机器人
|
|
0
|
203
|
2024 年1 月 6 日
|
Huggy Lingo: 利用机器学习改进 Hugging Face Hub 上的语言元数据
|
|
0
|
106
|
2024 年1 月 4 日
|
欢迎 Mixtral - 当前 Hugging Face 上最先进的 MoE 模型
|
|
0
|
267
|
2024 年1 月 4 日
|
Hugging Face 年度回顾:2023,开源大模型之年
|
|
0
|
122
|
2023 年12 月 29 日
|
Reformer 模型 - 突破语言建模的极限
|
|
0
|
196
|
2023 年12 月 27 日
|
混合专家模型 (MoE) 详解
|
|
0
|
335
|
2023 年12 月 26 日
|
3D 高斯点染简介
|
|
0
|
194
|
2023 年12 月 26 日
|
Google Colab 环境现已无需手动登录 HF 账号
|
|
0
|
222
|
2023 年12 月 22 日
|
在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现
|
|
0
|
291
|
2023 年12 月 19 日
|
3D 高斯喷溅 🤗 为什么图形永远不会相同
|
|
0
|
159
|
2023 年12 月 16 日
|
使用 PyTorch FSDP 微调 Llama 2 70B
|
|
0
|
298
|
2023 年12 月 11 日
|
使用 PyTorch 完全分片数据并行技术加速大模型训练
|
|
0
|
206
|
2023 年12 月 4 日
|
Google Colab 现已支持直接使用 🤗 transformers 库
|
|
0
|
203
|
2023 年12 月 1 日
|
Gradio-Lite: 完全在浏览器里运行的无服务器 Gradio
|
|
0
|
208
|
2023 年12 月 1 日
|
【AI 安全探索】AI 流行的时代,我们应该担心什么?
|
|
0
|
122
|
2023 年11 月 28 日
|
深入理解 BigBird 的块稀疏注意力
|
|
0
|
210
|
2023 年11 月 23 日
|
使用 LCM LoRA 4 步完成 SDXL 推理
|
|
0
|
326
|
2023 年11 月 23 日
|
使用 PPO 算法进行 RLHF 的 N 步实现细节
|
|
0
|
339
|
2023 年11 月 16 日
|
个人编程助手: 训练你自己的编码助手
|
|
0
|
273
|
2023 年11 月 14 日
|