使用 🤗 Optimum Intel 在英特尔至强上加速 StarCoder: Q8/Q4 及投机解码
|
|
0
|
124
|
2024 年2 月 20 日
|
LLaMA 2 - 你所需要的一切资源
|
|
0
|
318
|
2024 年2 月 19 日
|
听说有 Hugging Face 陪伴的春节,是这样的…
|
|
0
|
118
|
2024 年2 月 9 日
|
扩展说明: 指令微调 Llama 2
|
|
0
|
318
|
2024 年2 月 8 日
|
句子嵌入: 交叉编码和重排序
|
|
0
|
168
|
2024 年2 月 6 日
|
全世界 LoRA 训练脚本,联合起来!
|
|
0
|
318
|
2024 年2 月 5 日
|
随机 Transformer
|
|
0
|
228
|
2024 年1 月 29 日
|
最新 Hugging Face 强化学习课程(中文版)来啦!
|
|
0
|
167
|
2024 年1 月 22 日
|
SetFitABSA: 基于 SetFit 的少样本、方面级情感分析
|
|
0
|
146
|
2024 年1 月 18 日
|
给科研人的 ML 开源发布工具包
|
|
0
|
177
|
2024 年1 月 17 日
|
开放 LLM 排行榜: 深入研究 DROP
|
|
0
|
138
|
2024 年1 月 15 日
|
Hugging Face CEO: 2024 将是AI丰收年
|
|
0
|
98
|
2024 年1 月 12 日
|
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
|
|
0
|
135
|
2024 年1 月 10 日
|
非工程师指南: 训练 LLaMA 2 聊天机器人
|
|
0
|
254
|
2024 年1 月 6 日
|
Huggy Lingo: 利用机器学习改进 Hugging Face Hub 上的语言元数据
|
|
0
|
122
|
2024 年1 月 4 日
|
欢迎 Mixtral - 当前 Hugging Face 上最先进的 MoE 模型
|
|
0
|
326
|
2024 年1 月 4 日
|
Hugging Face 年度回顾:2023,开源大模型之年
|
|
0
|
163
|
2023 年12 月 29 日
|
Reformer 模型 - 突破语言建模的极限
|
|
0
|
232
|
2023 年12 月 27 日
|
混合专家模型 (MoE) 详解
|
|
0
|
418
|
2023 年12 月 26 日
|
3D 高斯点染简介
|
|
0
|
228
|
2023 年12 月 26 日
|
Google Colab 环境现已无需手动登录 HF 账号
|
|
0
|
271
|
2023 年12 月 22 日
|
在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现
|
|
0
|
341
|
2023 年12 月 19 日
|
3D 高斯喷溅 🤗 为什么图形永远不会相同
|
|
0
|
176
|
2023 年12 月 16 日
|
使用 PyTorch FSDP 微调 Llama 2 70B
|
|
0
|
361
|
2023 年12 月 11 日
|
使用 PyTorch 完全分片数据并行技术加速大模型训练
|
|
0
|
247
|
2023 年12 月 4 日
|
Google Colab 现已支持直接使用 🤗 transformers 库
|
|
0
|
243
|
2023 年12 月 1 日
|
Gradio-Lite: 完全在浏览器里运行的无服务器 Gradio
|
|
0
|
242
|
2023 年12 月 1 日
|
【AI 安全探索】AI 流行的时代,我们应该担心什么?
|
|
0
|
138
|
2023 年11 月 28 日
|
深入理解 BigBird 的块稀疏注意力
|
|
0
|
249
|
2023 年11 月 23 日
|
使用 LCM LoRA 4 步完成 SDXL 推理
|
|
0
|
374
|
2023 年11 月 23 日
|