全部应用
热门
图像生成
个性化图像
AI绘画
文生图
高清修复
图像转草图
去除背景
虚拟穿衣
图生图
证件照
人脸处理
图像LoRA训练
计算机视觉
三维重建
物体检测
对话认知
智能对话
智能搜索
故事续写
代码生成
长文创作
对话认知
图像描述
ollama
视频生成
模仿视频表情动作
文生视频
运动模仿
图生视频
视频配音
数字人
配音
虚拟交互对话
多模态
信息提取
智能对话
实时语音通话
实时视频通话
文生图
音频生成
文生音频
音频分离
文本转音乐
钢琴音频转MIDI
声音克隆
科学计算
天文软件
寻找脉冲星
其他
PDF文档提取
视频转GIF
Markdown转PPT
综合排序:
QWQ-32B-fp16
QWQ-32b
0
上传:陈东风
Llama-3.1-8B-Instruct自启动
Llama-3.1-8B-Instruct自启动
Meta 公司推出的一款功能强大的大型语言模型
对话认知
1
上传:陈思颖
Spark-TTS(开机自启动v1.0.0)
Spark-TTS(开机自启动v1.0.0)
本镜像带开机自启动功能,直接开机开放端口,然后访问网址即可。 程序一键启动、停止、重启的方法以及手动启动 Web 页面的方法见文档最后。
声音克隆
文生音频
19
上传:杨传龙
YOLOv12
YOLOv12
YOLOv12 是“你只看一次”(You Only Look Once, YOLO)系列的最新版本,于 2025 年 2 月发布。它引入了注意力机制,提升了检测精度,同时保持了高效的实时性能。YOLOv12 在保持速度的同时,显著提升了检测精度。例如,YOLOv12-N 在 T4 GPU 上的推理延迟为 1.64 毫秒,平均精度(mAP)达到 40.6%,相比 YOLOv10-N 和 YOLOv11-N 分别提升了 2.1% 和 1.2%
物体检测
2
上传:姚俊
CodeFormer自启动
CodeFormer自启动
基于CodeFormer模型实现面部复原、增强旧照片/修复AI艺术、面部颜色增强和修复、面部修复四个功能
高清修复
46
上传:姚俊
AnimateAnyone
AnimateAnyone
Animate Anyone是一款专门用于将静态图像转换为角色视频的创新型软件工具。它为众多用户,包括设计师、动画师、内容创作者等,提供了一种便捷且高效的方式来生成生动的角色动画视频,在多个领域均有涉足,例如娱乐、教育、营销等。
运动模仿
10
上传:姚俊
cosyvoice自启动
cosyvoice自启动
cosyvoice模型自启动
声音克隆
58
上传:陈思颖
LivePortrait自启动
LivePortrait自启动
LivePortrait模型自启动
模仿视频表情动作
20
上传:陈思颖
ChatGLM4(开机自启动v2.0.2)
ChatGLM4(开机自启动v2.0.2)
ChatGLM4(开机自启动v2.0.2)
对话认知
14
上传:杨传龙
deepseek-r1-8b-open-webui(开机自启动v1.0.2)
deepseek-r1-8b-open-webui(开机自启动v1.0.2)
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。本镜像为r1的8b蒸馏版
智能对话
故事续写
代码生成
11
上传:陈东风
deepseek-r1-70b-open-webui(开机自启动)
deepseek-r1-70b-open-webui(开机自启动)
DeepSeek-R1 的70b模型,仅次于满血deepseek的蒸馏版。deepseek-r1模型在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。本镜像为70b蒸馏版,在蒸馏版本中性能最强,并且本镜像带开机自启动功能
智能对话
对话认知
故事续写
代码生成
26
上传:陈东风
Direct3D(开机自启动v1.0.0)
Direct3D(开机自启动v1.0.0)
Direct3D:通过 3D 潜在扩散变换器实现可扩展图像到 3D 生成 (NeurIPS 2024) 我们引入了Direct3D,这是一种可扩展到自然输入图像的原生 3D 生成模型,无需多视图扩散模型或 SDS 优化。我们的方法包括两个主要组件:直接 3D 变分自动编码器(D3D-VAE)和直接 3D 扩散变换器(D3D-DiT)。D3D-VAE 可有效地将高分辨率 3D 形状编码为紧凑且连续的潜在三平面空间。值得注意的是,我们的方法使用半连续表面采样策略直接监督解码后的几何形状,不同于以前依赖渲染图像作为监督信号的方法。D3D-DiT 对编码的 3D 潜在特征的分布进行建模,专门用于融合三平面潜在特征图的位置信息,从而实现可扩展到大规模 3D 数据集的原生 3D 生成模型。此外,我们引入了一种创新的图像到 3D 生成流程,结合了语义和像素级图像条件,使模型能够生成与提供的条件图像输入一致的 3D 形状。大量实验证明了我们的大规模预训练 Direct3D 优于以前的图像到 3D 方法,实现了显著更好的生成质量和泛化能力,从而为 3D 内容创建建立了新的最先进水平。
三维重建
8
上传:杨传龙