• Posts tagged "deepseek"

Blog Archives

用Deepseek打造本地知识库

架构师的信仰系列文章,主要介绍我对系统架构的理解,从我的视角描述各种软件应用系统的架构设计思想和实现思路。

从程序员开始,到架构师一路走来,经历过太多的系统和应用。做过手机游戏,写过编程工具;做过大型Web应用系统,写过公司内部CRM;做过SOA的系统集成,写过基于Hadoop的大数据工具;做过外包,做过电商,做过团购,做过支付,做过SNS,也做过移动SNS。以前只用Java,然后学了PHP,现在用R和Javascript。最后跳出IT圈,进入金融圈,研发量化交易软件。

架构设计就是定义一套完整的程序规范,坚持架构师的信仰,做自己想做的东西。

关于作者:

  • 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
  • blog: http://blog.fens.me
  • email: bsspirit@gmail.com

转载请注明出处:
http://blog.fens.me/deepseek-anythingLLM-knowledge/

前言

DeepSeek的火热程度一直升温,各行各业都尝试利用Deepseek解决自己行业的问题。由于每个行业的特点不同,业务逻辑,知识结构等差异非常大,因此通用的推理逻辑并不是真正地解决行业的具体的问题,我们就需要打造本行业专属的知识库,用行业专属的知识解决行业的问题。

本文我们就尝试搭建自己的知识库。

目录

  1. AnythingLLM安装基础环境
  2. 创建工作区,接入DeepSeek
  3. 创建本地知识库

1. AnythingLLM安装基础环境

我们基于 Deepseek 模型来打造本地知识库,首先就是把DeepSeek进行本地安装,详细的安装过程请参考文章 Deepseek快速本地安装

当我们安装 DeepSeek 安装后,接下来需要安装 AnythingLLM 软件。 AnythingLLM,是一款全栈AI应用程序,可集成人工智能的多种功能,像文档、聊天、使用人工智能代理,完全支持本地和离线操作。

官网网址:https://anythingllm.com/desktop,进入网址后,进入官网主页。下载对应的版本,我本地操作系统是windows11,直接下载Download for Windows(X64),下载软件为 AnythingLLMDesktop.exe。

下载完成后,进行安装AnythingLLM软件。安装完成后,打开软件,你会看到简洁直观的界面:

直接点击Get started,即可进入后续操作步骤:

我们点击,向右的箭头。

注:如果安装过程中出现报错,可能是系统缺少某些必备组件,需要根据错误提示,安装相应的组件,确保安装顺利进行。

2. 创建工作区,接入DeepSeek

成功安装AnythingLLM后,打开软件,首先要创建一个工作区。给工作区起一个名字,即可快速创建工作区。每个工作区,可以理解为一个独立的空间,我们可以对不同类型的知识进行分类管理,方便后续查找和使用。

创建好工作区,我们选择配置,左下角的工具图标,用于接入DeepSeek。

切换到配置界面,让DeepSeek和AnythingLLM能够协同工作。

首先,设置语言,从英文界面切换为中文界面。

然后,通过 AnythingLLM 把 DeepSeek接入。接入过程有2个种接入方案。

  1. 通过本地接入,调用本地已部署好的 Ollama,接入DeepSeek。
  2. 通过DeepSeek的官方API接入,直接远程调用官方的在线模型,接入DeepSeek。

1). 通过本地接入,通过调用本地已部署好的 Ollama,接入DeepSeek。

在 LLM首选项菜单 中,选择 LLM供应商,选择Ollama。然后,他会自动检测本地已启动的Ollama服务,选择deepseek-r1:17b。如果Ollama是正常安装的,没有自动改动过配置,默认端口什么的都不用修改。

如果Ollama Model中,下拉菜单中就没deepseek模型,可能是本地Ollama 服务没有启动,请使用

ollama run deepseek-r1:7b

命令启动Ollama服务。如果没有安装Ollama服务,请参考文章 Deepseek快速本地安装,先安装好Ollama和Deepseek。

记得点击保存,“save change”。

配置好后,我们就可以直接返回聊天界面,开始使用anythingLLM了。

2). 通过DeepSeek的官方API接入,通过远程调用官方的在线模型,接入DeepSeek。

另一种方式,如果只想本地使用Deepseek,可以跳过本步骤。

我们把LLM供应商,选择为DeepSeek,即可直接使用Deepseek官方的服务,需要配置API key。

要这个API key,需要登录Deepseek的官网,选择左上角的 API开发平台,进行登录。

登录后,点击左侧菜单的 API keys,创建自己的API key。然后,把这个key输入到之前anythingLLM的配置界面中。这个API服务,是需要付费使用的。价格为每百万输入 tokens 2 元,每百万输出 tokens 8 元,不贵。

但在页面顶端,我们可以看到提示,“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停 API 服务充值。存量充值金额可继续调用,敬请谅解!”。也就是说,现在不开放API的充值了,所以这个路径暂时不通,后面等DeepSeek后面再开放,就可以这样使用了。

3. 创建本地知识库

上面成功把Deepseek入接后,直接返回聊天界面,问一下“你是谁”,就看到了DeepSeek-R1的回答。这样我们就让AnythingLLM和DeepSeek成功连接了。

接下来,让我们上传自己的知识库。在左边对话框,点击上传文件的按钮,选择文本文件上传。

我上传的文件为:段永平先生采访记录,文件下载,2万字全文.pdf

在文件先拖到左边的文件上传蓝色区域 “Click to upload or drag and drop”。上传完成后,把左边的文件拖到右边,进行文本向量转化,它能将输入的文本转化为对应的向量表示。在这个转化过程中,模型会深入分析文本的词汇、语句结构以及语义关联。这种向量表示并非简单的数值罗列,而是蕴含了文本的语义特征,为后续的各种操作提供了基础。

然后,我们回到对话窗口,找一个文件中,有持人问段永平的问题,请deepseek提问。“请问一个好赛道往往会随着竞争的加剧而进入低毛利的时期,那么在这样低毛利的一个时期下,创业者该如何应对呢?”

可以看到Deepseek的回答,总结很大气。

在对比,同样的问题,同一个本地模型,没有用到知识库的情况,Deepseek给的回复。为了区别,我们需要新建一个工作区,命名“测试2”。

两者的主要观点看起来差不多,但从表述上的感觉还是有不少差异,2位专家2个视角,这就是本地知识库带来的影响。下篇文件,我将对比不同模型,对于相同问题,在不同知识领域下的影响。

随着对 Deepseek 的深入使用和能力挖掘,希望能让AI真正成为我们实际工作的得力干将。

转载请注明出处:
http://blog.fens.me/deepseek-anythingLLM-knowledge/

Deepseek快速本地安装

架构师的信仰系列文章,主要介绍我对系统架构的理解,从我的视角描述各种软件应用系统的架构设计思想和实现思路。

从程序员开始,到架构师一路走来,经历过太多的系统和应用。做过手机游戏,写过编程工具;做过大型Web应用系统,写过公司内部CRM;做过SOA的系统集成,写过基于Hadoop的大数据工具;做过外包,做过电商,做过团购,做过支付,做过SNS,也做过移动SNS。以前只用Java,然后学了PHP,现在用R和Javascript。最后跳出IT圈,进入金融圈,研发量化交易软件。

架构设计就是定义一套完整的程序规范,坚持架构师的信仰,做自己想做的东西。

关于作者:

  • 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
  • blog: http://blog.fens.me
  • email: bsspirit@gmail.com

转载请注明出处:
http://blog.fens.me/deepseek-start/

前言

2025年的春节,是个不一样的春节。Deepseek一声惊雷,让整个春节被全球媒体刷屏了。

不仅是国家层面的竞争格局发生了变化,同时,也让我们普通人拉平了与大模型大厂的差距,新的AI时代开始了。

目录

  1. Deepseek是什么
  2. 安装Ollama
  3. 安装Deepseek
  4. 安装webui界面

1. Deepseek是什么

Deepseek是什么?我们本地部署好后,让Deepseek自己来回答。

“深度求索人工智能基础技术研究有限公司(简称“深度求索”或“DeepSeek”),成立于2023年,是一家专注于实现AGI的中国公司。”

在命令行中,启动Deepseek,问:Deepseek是什么。

如果不想本地安装,也可以直接使用Deepseek的官方网站进行注册,使用在线的Deepseek服务:https://www.deepseek.com/

Deepseek官网就已经写明了,DeepSeek-R1已发布并开源,性能对标OpenAI o1正式版。那么,我们就本地部署DeepSeek-R1模型。

2. 安装Ollama

本地部署Deepseek是要用到 Ollama,它能支持很多大模型。Ollama官方网站:https://ollama.com/

选择DeepSeek-R1,就进入了模型页面。

DeepSeek-R1模型共有7个版本,分别对应不同的参数级别 1.5b,7b,8b,14b,32b,70b,671b。数值越大,参数越高,效果越好,但需要的硬件资源也会越高。我在本地电脑部署,就选个小点的7b模型。

我本地电脑环境为:

  • Win11,64位,x86架构
  • CPU: Intel i7-9750H 2.6G
  • 内存: 48G
  • 显卡:GPU NVIDIA Quadro T2000 24G

我们选Ollama软件包下载,OllamaSetup.exe。然后,按install进行安装。Ollama只能安装在C盘,不能修改路径,请小伙伴一定,留出足够多的空间来,至少20G,不然会影响到,滞后电脑的运行。

安装好后,就有了ollama的一个应用程序,运行后右下角度会出现 ollama 的图标。

3. 安装Deepseek

然后打开windows的命令行,输入

ollama run deepseek-r1:7b

下载deepseek-r1:7b模型,并进行安装,有4.7GB。下载大概要30分钟左右。然后,会自动运行,我们可以输入hello,和deepseek模型进行对话了。

如果关上了命令行窗口,重新打开,可以再次输入。

ollama run deepseek-r1:7b

这样就成功运行了,DeepSeek-R1的7b模型。

4. 安装webui界面

在命令行运行后,使用起来不太直观,我们可以再安装一个webui的界面,以更方便的方式进行使用。

4.1 安装python

这里选择基于python的open-webui开源界面工具。首先要安装python,open-webui要求python的最低版本要大于3.11,请先去python官网下载最新的版本,https://www.python.org/downloads/

我选择下载了python 3.12-8版本,当然也可以选择 3.13.1版本。

用python-3.12.8-amd64.exe文件进行安装,然后配置环境变量,

新打开一个命令行,输出python,启动python命令行,即安装成功。

然后,按ctrl+D 退出python命令行,安装 open-webui 的界面。

先安装pip工具,pip工具是用于python的工具包管理,使用pip来安装各种python 工具包。

python -m pip install --upgrade pip

4.2 安装open-webui

完成后,使用pip安装open-webui包。这个过程,要安装很多的包,如果要持续30分钟左右。

pip install open-webui

这里通常会错一个错误,就是缺少C++的一个编译库,需要下载Microsoft C++ 生成工具,打开连接
https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/

安装好后,打开visual studio installer工具,选择C++桌面开发,再安装一些工具包。

然后再执行安装open-webui,这样就成功安装了。

pip install open-webui

4.3 启动open-webui

然后,我们再通过命令行,输入open-webui serve命令,就可以启动open webui的界面。

open-webui serve

配置好登录信息后,webui的客户端就会自动连接上,我们本地启动的deepseek模型了。

然后就可以使用的更方便的webui进行与deepseek的对话了。

webui的后面程序日志,看到前后端的交互情况。

Deepseek的横空出世拉平了,我与大厂的距离,我们所有人都战在了同一起跑线。祝大家2025新年快乐!!

转载请注明出处:
http://blog.fens.me/deepseek-start/