近日,开源最前线(ID:OpenSourceTop) 盘点了 11 月份 GitHub 上最热门的开源项目。在本月的名单中,有 15 亿参数量的通用语言模型、还有 NLP 工具包、面试指南等,以下为榜单详情。
1.VSCode https://github.com/microsoft/vscode Star 87712
VSCode 是微软推出的一款优秀的 IDE 开发工具,界面简洁美观,默认支持中文,拥有丰富的插件,且支持 Windows、OS X 和 Linux。此外,其内置 JavaScript、TypeScript 和 Node.js 支持。VSCode 的定位位于编辑器与 IDE 之间,但是更像一个编辑器。
2.JavaGuide https://github.com/Snailclimb/JavaGuide star 63343
这是一份”Java 学习 + 面试指南“,它涵盖了大部分 Java 程序员所需要掌握的核心知识。
3.Algorithm Visualizer https://github.com/algorithm-visualizer/algorithm-visualizer Star 27016
这是一个交互式的在线平台,可以将算法可视化,通过动图的方式学习算法将会变得容易的多。
4.HanLP https://github.com/hankcs/HanLP Star 16785
这是一系列模型与算法组成的 NLP 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便。
5.Real Time Voice Cloning https://github.com/CorentinJ/Real-Time-Voice-Cloning Sara 13118
这是一个基于深度学习的语音合成项目,它通过采集分析一段具体的声音样本,可在 5 秒内生成与之类似的克隆语音。
6. 数据结构和算法必知必会的 50 个代码实现 https://github.com/wangzheng0822/algo Star 11472
该项目的创建者是极客时间专栏《数据结构和算法之美》的作者王争,该项目包含了数据结构与算法必知必会的 50 个代码实现,诸如数组、链表、栈、队列等算法实现。
7.GPT-2 https://github.com/openai/gpt-2 Star 10094
这是由 OpenAI 发布的 15 亿参数量通用语言模型。训练 GPT-2 是为了预测 40GB 互联网文本中的下一个单词。GPT-2 是基于 TransFormer 的大型语言模型,包含 15 亿参数,在一个 800 万网页数据集上训练而成。
8.JEECG Boot https://github.com/zhangdaiscott/jeecg-boot Star 7861
这是一款基于代码生成器的 Java 快速开发平台,号称开源界“小普元”,超越传统商业企业级开发平台。采用前后端分离架构(SpringBoot 2.x、Ant Design&Vue、Mybatis-plus、Shiro、JWT),其强大的代码生成器让前后端代码一键生成,无需写任何代码,号称可以帮助 Java 项目解决 70% 的重复工作,让开发人员更关注业务逻辑。
9.Flink Learning https://github.com/zhisheng17/flink-learning Star 3342
该项目含 Flink 入门、概念、原理、实战、性能调优、源码解析等内容。涉及 Flink Connector、Metrics、Library、DataStream API、Table API & SQL 等内容的学习案例,还有 Flink 落地应用的大型项目案例分享。
10.Java Interview https://github.com/gzc426/Java-Interview Star 2362
该项目是一个 Java 面试指南,包含 Java 基础知识、项目推荐、知识点整理、Java 相关资源整理以及 MySQL 优化等。