Popular repositories Loading
-
Build-A-Large-Language-Model-CN
Build-A-Large-Language-Model-CN Public《Build a Large Language Model (From Scratch)》是一本深入探讨大语言模型原理与实现的电子书,适合希望深入了解 GPT 等大模型架构、训练过程及应用开发的学习者。为了让更多中文读者能够接触到这本极具价值的教材,我决定将其翻译成中文,并通过 GitHub 进行开源共享。
-
AI-TASK-MANAGER
AI-TASK-MANAGER Public一个用于AI驱动开发的通用任务管理系统,使用Google Gemini模型,专为与Cursor AI无缝协作而设计。
-
VideoLingua
VideoLingua Public视频字幕处理工具 - 一站式视频字幕提取、翻译、烧录和内容总结解决方案。基于OpenAI Whisper和Google Gemini API,支持多语言处理、双语字幕、自定义烧录和智能视频内容总结。模块化设计,既可独立使用各功能,也可一键完成全流程处理。适合内容创作者、翻译人员和视频编辑工作者使用。
-
AI-GAME-RULE-EXTRACTOR
AI-GAME-RULE-EXTRACTOR PublicAI-GAME-RULE-EXTRACTOR is an innovative project developed based on Microsoft's paper [《MM-VID: Advancing Video Understanding with GPT-4V(ision)》](https://arxiv.org/abs/2310.19773)
-
AI-VIDEO-UNSERSTANDING
AI-VIDEO-UNSERSTANDING PublicAI video analysis tool: Extracts audio transcripts (Whisper) & visual subtitles (Vision LLM), then generates summaries using LLMs (Gemini/Qwen). Features multi-modal processing and speed optimizati…
Python 3
-
If the problem persists, check the GitHub status page or contact support.