构建一个真正有效的简单搜索引擎 | blog | #教程 #搜索引擎

“我知道你在想什么。“为什么不直接使用Elasticsearch?”或者“那Algolia怎么样?”这些都是有效的选择,但它们也带来了复杂性。你需要学习它们的API,管理它们的基础设施,并处理它们的各种怪癖。
有时候,你只想要一个:
※与现有数据库兼容的
※不需要外部服务的
※易于理解和调试的
※能够真正找到相关结果的

这就是我所构建的。一个使用你现有数据库的搜索引擎,尊重你当前的架构,并且让你完全掌控它的工作方式。

核心理念
这个概念很简单:将一切进行标记化(tokenize),存储起来,然后在搜索时匹配标记。

它的工作原理如下:
※索引:当你添加或更新内容时,我们将其分解为标记(单词、前缀、n-grams),并带有权重地存储它们
※搜索:当有人进行搜索时,我们以相同的方式对他们的查询进行标记,找到匹配的标记,并对结果进行评分
※评分:我们使用存储的权重来计算相关性分数

其中的关键在于标记化和加权。让我给你演示一下我的意思。”
官方 PyTorch 初学者系列,全面覆盖深度学习入门

• 从基础张量操作、自动微分(autograd)讲起,逐步深入模型构建与训练。
• 8 个详尽教程,系统梳理 PyTorch 全流程,适合零基础友好入门。
• 包含生产环境部署实战,帮助理解理论与应用无缝衔接。
• 教学风格清晰,注重方法论提炼,助力长期掌握 PyTorch 核心技术。
• 课程内容紧贴行业实战,提升开发效率与模型实用性。

PyTorch Beginner Series | #教程
llm-course:一站式学习大型语言模型(LLM)的免费课程。| #教程

课程分为LLM基础、科学家、工程师三部分,覆盖从理论到实践的全过程;提供多种实用工具,如模型合并、量化、自动评估等;互动式学习体验,配备LLM助教答疑
Happy-LLM:从零开始的大语言模型原理与实践教程,带你深入探索LLM的世界。| #教程

系统性教程,从NLP基础到LLaMA2实现;动手实践,涵盖预训练到微调全流程;结合前沿技术,如RAG和Agent
掌握大型语言模型(LLM)工程的8周实战课程,带你从零到精通

提供详细的PC、Mac和Linux环境搭建指南;每周项目实战,涵盖从基础到高级的LLM应用;免费使用Google Colab GPU资源,无需高昂API费用

llm_engineering | #教程
牛津大学数学系的信息论课程,带你深入理解信息的数学本质。

由牛津大学数学系教授Sam Cohen亲自授课;八个精心制作的视频讲座,涵盖信息论的核心概念;深入浅出,适合信息科学和数学专业的学生及爱好者

Student Lectures - Information Theory | #教程
让CPU也能玩转大模型部署的开源教程。

提供从基础到进阶的全方位内容,覆盖多平台安装与配置;支持多种编程语言调用Ollama API,拓展性强;丰富的应用案例,包括本地AI Copilot和RAG应用搭建

动手学 Ollama 教程 | #教程
Hands-On-LLM-Fine-Tuning:一站式大语言模型微调教程,轻松上手LLM微调 | #教程

提供多种微调技术,涵盖全参数微调、参数高效微调等;详细教程助力小白快速入门;丰富的实战案例,覆盖金融、推理等多个领域
十分钟物理系列教程,教你用JavaScript写物理现象模拟,如火焰、弹球碰撞、欧拉流体等,每个教程配有详细的笔记、代码、demo和教学视频。

Ten Minute Physics | #教程
系列教程: 如何编写一个bootloader | #教程 #c++

从汇编语言开始,然后逐步编写 C++
一本面向初学者的C语言教程,提供代码示例和详细解释,适合自学者和编程爱好者

Beej's C编程指南 | #教程
开源的全栈Web开发课程,提供结构化课程和实践项目,帮助用户通过构建项目来巩固理论知识

The Odin Project Curriculum | #教程
自然语言处理(NLP)领域的入门到精通教程,包含从分词器到Transformer架构的全面内容,旨在帮助学习者掌握NLP的核心概念并理解其发展脉络

NLP Zero to Hero | #教程
DIY 安全:如何创建自己的强密码生成器 | 详文 | #教程
交互式教程,专注于提升提示工程技能,教授如何构建有效的提示来引导人工智能的响应,包含多个Jupyter Notebook文件,涵盖从基础结构到复杂提示构建的各个方面

Anthropic courses | #教程
用go语言实现一个类似docker的容器系列教程。

本系列教程主要是为了弄清楚容器化的原理,纸上得来终觉浅,绝知此事要躬行,理论始终不及动手实践来的深刻,所以这个系列会用go语言实现一个类似docker的容器化功能,最终能够容器化的运行一个进程。

tinydocker | #教程
svg教程网站 | #教程

该系列教程详细介绍了如何使用SVG(可缩放矢量图形)创建图形,从基础形状到复杂路径和动画。

教程包括基本形状的绘制、使用路径(path)创建复杂图形、添加样式和颜色、以及为图形添加动画效果。

每个教程都提供了实际代码示例和详细解释,帮助读者逐步掌握SVG的使用技巧。
Media is too big
VIEW IN TELEGRAM
PyTorch实用教程(第二版):面向深度学习工程师的全面指南,覆盖从零基础到项目应用和工程化部署的各个阶段,旨在帮助读者轻松掌握PyTorch的使用 | #教程
《动手学大模型》系列编程实践教程 | #教程

教程由上海交通大学《人工智能安全技术》课程讲义拓展而来(教师:张倬胜),旨在提供大模型相关的入门编程参考。通过简单实践,可快速入门大模型,更好地开展课程设计或学术研究。
从零开始的 JSON 库教程 | #教程

“也许有很多同学上过 C/C++ 的课后,可以完成一些简单的编程练习,又能在一些网站刷题,但对于如何开发有实际用途的程序可能感到束手无策。本教程希望能以一个简单的项目开发形式,让同学能逐步理解如何从无到有去开发软件。

为什么选择 JSON?因为它足够简单,除基本编程外不需大量技术背景知识。JSON 有标准,可按照标准逐步实现。JSON 也是实际在许多应用上会使用的格式,所以才会有大量的开源库。“
 
 
Back to Top