日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 軟件

Python 教你三分鐘用Bert搭建問答搜索引擎

來源: 責編: 時間:2024-04-29 09:04:08 210觀看
導讀鼎鼎大名的 Bert 算法相信大部分同學都聽說過,它是Google推出的NLP領域“王炸級”預訓練模型,其在NLP任務中刷新了多項記錄,并取得state of the art的成績。但是有很多深度學習的新手發現BERT模型并不好搭建,上手難度很高

鼎鼎大名的 Bert 算法相信大部分同學都聽說過,它是Google推出的NLP領域“王炸級”預訓練模型,其在NLP任務中刷新了多項記錄,并取得state of the art的成績。Ugk28資訊網——每日最新資訊28at.com

但是有很多深度學習的新手發現BERT模型并不好搭建,上手難度很高,普通人可能要研究幾天才能勉強搭建出一個模型。Ugk28資訊網——每日最新資訊28at.com

沒關系,今天我們介紹的這個模塊,能讓你在3分鐘內基于BERT算法搭建一個問答搜索引擎。它就是 bert-as-service 項目。這個開源項目,能夠讓你基于多GPU機器快速搭建BERT服務(支持微調模型),并且能夠讓多個客戶端并發使用。Ugk28資訊網——每日最新資訊28at.com

1.準備

Ugk28資訊網——每日最新資訊28at.com

Ugk28資訊網——每日最新資訊28at.com

開始之前,你要確保Python和pip已經成功安裝在電腦上,如果沒有,可以訪問這篇文章:超詳細Python安裝指南 進行安裝。Ugk28資訊網——每日最新資訊28at.com

(可選1) 如果你用Python的目的是數據分析,可以直接安裝Anaconda:Python數據分析與挖掘好幫手—Anaconda,它內置了Python和pip.Ugk28資訊網——每日最新資訊28at.com

(可選2) 此外,推薦大家用VSCode編輯器,它有許多的優點:Python 編程的最好搭檔—VSCode 詳細指南。Ugk28資訊網——每日最新資訊28at.com

請選擇以下任一種方式輸入命令安裝依賴:1. Windows 環境 打開 Cmd (開始-運行-CMD)。2. MacOS 環境 打開 Terminal (command+空格輸入Terminal)。3. 如果你用的是 VSCode編輯器 或 Pycharm,可以直接使用界面下方的Terminal.Ugk28資訊網——每日最新資訊28at.com

pip install bert-serving-server # 服務端pip install bert-serving-client # 客戶端

Ugk28資訊網——每日最新資訊28at.com

請注意,服務端的版本要求:Python >= 3.5,Tensorflow >= 1.10 。Ugk28資訊網——每日最新資訊28at.com

此外還要下載預訓練好的BERT模型,在 https://github.com/hanxiao/bert-as-service#install 上可以下載,如果你無法訪問該網站,也可以在 https://pythondict.com/download/bert-serving-model/ 此處下載。Ugk28資訊網——每日最新資訊28at.com

也可在Python實用寶典后臺回復 bert-as-service 下載這些預訓練好的模型。Ugk28資訊網——每日最新資訊28at.com

下載完成后,將 zip 文件解壓到某個文件夾中,例如 /tmp/uncased_L-24_H-1024_A-16/.Ugk28資訊網——每日最新資訊28at.com

2.Bert-as-service 基本使用

Ugk28資訊網——每日最新資訊28at.com

Ugk28資訊網——每日最新資訊28at.com

安裝完成后,輸入以下命令啟動BERT服務:Ugk28資訊網——每日最新資訊28at.com

bert-serving-start -model_dir /tmp/uncased_L-24_H-1024_A-16/ -num_worker=4

Ugk28資訊網——每日最新資訊28at.com

-num_worker=4 代表這將啟動一個有四個worker的服務,意味著它最多可以處理四個并發請求。超過4個其他并發請求將在負載均衡器中排隊等待處理。Ugk28資訊網——每日最新資訊28at.com

下面顯示了正確啟動時服務器的樣子:Ugk28資訊網——每日最新資訊28at.com

圖片圖片Ugk28資訊網——每日最新資訊28at.com

使用客戶端獲取語句的編碼

現在你可以簡單地對句子進行編碼,如下所示:Ugk28資訊網——每日最新資訊28at.com

from bert_serving.client import BertClientbc = BertClient()bc.encode(['First do it', 'then do it right', 'then do it better'])

Ugk28資訊網——每日最新資訊28at.com

作為 BERT 的一個特性,你可以通過將它們與 |||(前后有空格)連接來獲得一對句子的編碼,例如Ugk28資訊網——每日最新資訊28at.com

bc.encode(['First do it ||| then do it right'])

Ugk28資訊網——每日最新資訊28at.com

圖片圖片Ugk28資訊網——每日最新資訊28at.com

Ugk28資訊網——每日最新資訊28at.com

遠程使用 BERT 服務

你還可以在一臺 (GPU) 機器上啟動服務并從另一臺 (CPU) 機器上調用它,如下所示:Ugk28資訊網——每日最新資訊28at.com

Ugk28資訊網——每日最新資訊28at.com

# on another CPU machinefrom bert_serving.client import BertClientbc = BertClient(ip='xx.xx.xx.xx') # ip address of the GPU machinebc.encode(['First do it', 'then do it right', 'then do it better'])

Ugk28資訊網——每日最新資訊28at.com

3.搭建問答搜索引擎

Ugk28資訊網——每日最新資訊28at.com

Ugk28資訊網——每日最新資訊28at.com

我們將通過 bert-as-service 從FAQ 列表中找到與用戶輸入的問題最相似的問題,并返回相應的答案。Ugk28資訊網——每日最新資訊28at.com

FAQ列表其實就是官方文檔的readme.md, 在我提供的下載鏈接里也附帶了。Ugk28資訊網——每日最新資訊28at.com

1. 加載所有問題,并顯示統計數據:Ugk28資訊網——每日最新資訊28at.com

prefix_q = '##### **Q:** 'with open('README.md') as fp:    questions = [v.replace(prefix_q, '').strip() for v in fp if v.strip() and v.startswith(prefix_q)]    print('%d questions loaded, avg. len of %d' % (len(questions), np.mean([len(d.split()) for d in questions])))    # 33 questions loaded, avg. len of 9

Ugk28資訊網——每日最新資訊28at.com

一共有33個問題被加載,平均長度是9.Ugk28資訊網——每日最新資訊28at.com

2. 然后使用預訓練好的模型:uncased_L-12_H-768_A-12 啟動一個Bert服務:Ugk28資訊網——每日最新資訊28at.com

bert-serving-start -num_worker=1 -model_dir=/data/cips/data/lab/data/model/uncased_L-12_H-768_A-12

Ugk28資訊網——每日最新資訊28at.com

3. 接下來,將我們的問題編碼為向量:Ugk28資訊網——每日最新資訊28at.com

bc = BertClient(port=4000, port_out=4001)doc_vecs = bc.encode(questions)

Ugk28資訊網——每日最新資訊28at.com

4. 最后,我們準備好接收用戶的查詢,并對現有問題執行簡單的“模糊”搜索。Ugk28資訊網——每日最新資訊28at.com

為此,每次有新查詢到來時,我們將其編碼為向量并計算其點積  doc_vecs 然后對結果進行降序排序,返回前N個類似的問題:Ugk28資訊網——每日最新資訊28at.com

while True:    query = input('your question: ')    query_vec = bc.encode([query])[0]    # compute normalized dot product as score    score = np.sum(query_vec * doc_vecs, axis=1) / np.linalg.norm(doc_vecs, axis=1)    topk_idx = np.argsort(score)[::-1][:topk]    for idx in topk_idx:        print('> %s/t%s' % (score[idx], questions[idx]))

Ugk28資訊網——每日最新資訊28at.com

完成!現在運行代碼并輸入你的查詢,看看這個搜索引擎如何處理模糊匹配:Ugk28資訊網——每日最新資訊28at.com

圖片圖片Ugk28資訊網——每日最新資訊28at.com

Ugk28資訊網——每日最新資訊28at.com

完整代碼如下,一共23行代碼:Ugk28資訊網——每日最新資訊28at.com

import numpy as npfrom bert_serving.client import BertClientfrom termcolor import coloredprefix_q = '##### **Q:** 'topk = 5with open('README.md') as fp:    questions = [v.replace(prefix_q, '').strip() for v in fp if v.strip() and v.startswith(prefix_q)]    print('%d questions loaded, avg. len of %d' % (len(questions), np.mean([len(d.split()) for d in questions])))with BertClient(port=4000, port_out=4001) as bc:    doc_vecs = bc.encode(questions)    while True:        query = input(colored('your question: ', 'green'))        query_vec = bc.encode([query])[0]        # compute normalized dot product as score        score = np.sum(query_vec * doc_vecs, axis=1) / np.linalg.norm(doc_vecs, axis=1)        topk_idx = np.argsort(score)[::-1][:topk]        print('top %d questions similar to "%s"' % (topk, colored(query, 'green')))        for idx in topk_idx:            print('> %s/t%s' % (colored('%.1f' % score[idx], 'cyan'), colored(questions[idx], 'yellow')))

夠簡單吧?當然,這是一個基于預訓練的Bert模型制造的一個簡單QA搜索模型。Ugk28資訊網——每日最新資訊28at.com

你還可以微調模型,讓這個模型整體表現地更完美,你可以將自己的數據放到某個目錄下,然后執行 run_classifier.py 對模型進行微調,比如這個例子:Ugk28資訊網——每日最新資訊28at.com

https://github.com/google-research/bert#sentence-and-sentence-pair-classification-tasksUgk28資訊網——每日最新資訊28at.com

本文鏈接:http://m.www897cc.com/showinfo-26-86340-0.htmlPython 教你三分鐘用Bert搭建問答搜索引擎

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 系統設計中跨時區問題 解決方案

下一篇: Go 語言將 PDF 轉為 Word ,代碼怎么實現 ?

標簽:
  • 熱門焦點
  • Golang 中的 io 包詳解:組合接口

    io.ReadWriter// ReadWriter is the interface that groups the basic Read and Write methods.type ReadWriter interface { Reader Writer}是對Reader和Writer接口的組合,
  • 騰訊蓋樓,字節拆墻

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之“想重溫暴刷深淵、30+技能搭配暴搓到爽的游戲體驗嗎?一起上晶核,即刻暴打!”曾憑借直播騰訊旗下代理格斗游戲《DNF》一
  • 自律,給不了Keep自由!

    來源 | 互聯網品牌官作者 | 李大為編排 | 又耳 審核 | 谷曉輝自律能不能給用戶自由暫時不好說,但大概率不能給Keep自由。近日,全球最大的在線健身平臺Keep正式登陸港交所,努力
  • 花7萬退貨退款無門:誰在縱容淘寶珠寶商家造假?

    來源:極點商業作者:楊銘在淘寶購買珠寶玉石后,因為保證金不夠賠付,店鋪關閉,退貨退款難、維權無門的比比皆是。“提供相關產品鑒定證書,支持全國復檢,可以30天無理由退換貨。&
  • 認真聊聊東方甄選:如何告別低垂的果實

    來源:山核桃作者:財經無忌爆火一年后,俞敏洪和他的東方甄選依舊是頗受外界關心的“網紅”。7月5日至9日,為期5天的東方甄選“甘肅行”首次在自有App內直播,
  • 三星顯示已開始為AR設備研發硅基LED微顯示屏

    7月18日消息,據外媒報道,隨著蘋果首款頭顯產品Vision Pro在6月份正式推出,AR/VR/MR等頭顯產品也就將成為各大公司下一個重要的競爭領域,對顯示屏這一關
  • OPPO K11評測:旗艦級IMX890加持 2000元檔最強影像手機

    【Techweb評測】中端機型用戶群體巨大,占了中國目前手機市場的大頭,一直以來都是各手機品牌的“必爭之地”,其中OPPO K系列機型一直以來都以高品質、
  • 由于成本持續增加,筆記本產品價格預計將明顯上漲

    根據知情人士透露,由于材料、物流等成本持續增加,筆記本產品價格預計將在2021年下半年有明顯上漲。進入6月下旬以來,全球半導體芯片缺貨情況加劇,顯卡、處理器
  • 中關村論壇11月25日開幕,15位諾獎級大咖將發表演講

    11月18日,記者從2022中關村論壇新聞發布會上獲悉,中關村論壇將于11月25至30日在京舉行。本屆中關村論壇由科學技術部、國家發展改革委、工業和信息化部、國務
Top 日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不
国产主播一区二区三区| 欧美日韩国产综合视频在线观看| 日韩性生活视频| 99爱精品视频| 亚洲欧美激情诱惑| 久久亚洲高清| 欧美日韩中文字幕在线| 国产精品亚洲欧美| 伊人久久亚洲热| 夜夜嗨一区二区三区| 欧美资源在线观看| 欧美激情视频在线播放| 国产精品麻豆va在线播放| 韩国女主播一区二区三区| 亚洲精品美女在线观看| 亚洲自拍电影| 母乳一区在线观看| 国产精品毛片在线看| 激情小说亚洲一区| 亚洲图片自拍偷拍| 看片网站欧美日韩| 国产精品久久久久久久免费软件| 在线国产欧美| 亚洲伊人久久综合| 蜜臀久久久99精品久久久久久| 欧美亚洲第一区| 亚洲电影av| 欧美一区二区日韩| 欧美日韩另类丝袜其他| 国内外成人免费激情在线视频网站| 亚洲美女在线一区| 久久久久久久久久码影片| 欧美性天天影院| 亚洲激情视频在线观看| 性久久久久久久久久久久| 欧美成人一区二区三区在线观看| 国产精品影片在线观看| 亚洲美女在线国产| 久久综合伊人77777蜜臀| 国产精品久久亚洲7777| 亚洲精品国产欧美| 欧美在线综合视频| 久久久国产亚洲精品| 亚洲欧美一区二区激情| 欧美国产精品专区| 国产一区二区三区在线观看视频 | 国产色综合天天综合网| 日韩一区二区精品| 狂野欧美激情性xxxx欧美| 国产乱码精品| 亚洲视频免费观看| 欧美精品三级| 在线观看日产精品| 欧美综合国产| 国产精品―色哟哟| 亚洲视频福利| 欧美日韩免费观看一区=区三区| 在线播放豆国产99亚洲| 久久国产精品黑丝| 国产精品一区二区久激情瑜伽| 亚洲美女视频| 欧美成年人视频网站| 黑人一区二区| 久久精品盗摄| 国产欧美大片| 亚洲欧美国产一区二区三区| 欧美三日本三级少妇三2023| 亚洲精品一区二区三区樱花| 欧美91视频| 亚洲国产欧美日韩另类综合| 久久综合免费视频影院| 精品91在线| 久久综合九色综合网站| 国产在线精品二区| 久久精品国产96久久久香蕉| 国产伦精品免费视频| 午夜免费日韩视频| 国产乱子伦一区二区三区国色天香 | 欧美14一18处毛片| 亚洲国产精品第一区二区| 久久久噜噜噜久久人人看| 欧美欧美全黄| 一本久久综合亚洲鲁鲁五月天| 欧美精品色网| 日韩一区二区高清| 欧美日韩在线免费视频| 中文国产成人精品久久一| 欧美午夜在线一二页| 亚洲中字黄色| 国产乱码精品一区二区三区忘忧草 | 亚洲小说欧美另类社区| 欧美午夜视频网站| 亚洲欧美日本伦理| 国产欧美综合在线| 久久精品亚洲精品国产欧美kt∨| 韩国av一区| 老司机一区二区三区| 亚洲国产另类久久精品| 欧美大片免费观看在线观看网站推荐| 亚洲黄色成人| 欧美日韩在线影院| 欧美亚洲网站| 激情欧美国产欧美| 欧美v国产在线一区二区三区| 亚洲欧洲精品成人久久奇米网| 欧美区在线播放| 亚洲一卡二卡三卡四卡五卡| 国产欧美日韩视频| 裸体女人亚洲精品一区| 日韩视频在线免费观看| 欧美午夜一区二区| 欧美一级片久久久久久久| 激情综合电影网| 欧美高清视频在线| 亚洲专区国产精品| 国模私拍视频一区| 欧美国产1区2区| 亚洲午夜在线观看视频在线| 国产日韩欧美高清免费| 久热re这里精品视频在线6| 999亚洲国产精| 国产精品中文在线| 久久午夜精品| 9l国产精品久久久久麻豆| 国产欧美精品一区二区三区介绍 | 日韩亚洲欧美高清| 国产精品入口| 久久视频在线视频| 99在线精品视频| 国产性色一区二区| 欧美精品一区二区精品网| 一区二区三区视频观看| 国产亚洲成年网址在线观看| 欧美+亚洲+精品+三区| 亚洲一本大道在线| 一区二区三区无毛| 国产精品jvid在线观看蜜臀 | 欧美日韩免费高清一区色橹橹| 欧美一级片久久久久久久| 亚洲精品日韩在线| 国产精品亚洲综合色区韩国| 麻豆成人在线| 亚洲欧美日韩直播| 亚洲片在线资源| 国产视频精品va久久久久久| 欧美极品一区| 久久久久久伊人| 亚洲视频电影图片偷拍一区| 激情成人在线视频| 国产精品裸体一区二区三区| 欧美高清不卡| 欧美在线视频一区二区三区| 日韩午夜在线观看视频| 黄色一区二区在线| 国产精品外国| 欧美日韩一区不卡| 欧美高清视频一区| 久久久五月天| 午夜精品影院| 一区二区激情视频| 亚洲激情自拍| 黑人巨大精品欧美一区二区小视频 | 亚洲中无吗在线| 亚洲国产精品t66y| 国产亚洲在线| 国产精品嫩草久久久久| 欧美成人精品三级在线观看| 久久精品视频播放| 午夜精彩国产免费不卡不顿大片| 亚洲精选一区二区| 亚洲第一色在线| 国产综合精品一区| 国产乱码精品一区二区三| 国产精品va在线播放| 欧美乱妇高清无乱码| 免费在线亚洲欧美| 久久偷看各类wc女厕嘘嘘偷窃| 性8sex亚洲区入口| 亚洲午夜极品| 一区二区三区日韩欧美| 日韩小视频在线观看专区| 亚洲日本免费| 亚洲欧洲日产国产综合网| 禁断一区二区三区在线| 国产亚洲欧洲997久久综合| 国产精品亚洲网站| 国产精品视频xxxx| 国产精品国产福利国产秒拍| 欧美日韩一区二区三区四区五区| 欧美精品videossex性护士| 免费成人高清| 免费美女久久99| 免费在线欧美黄色| 麻豆精品精华液| 久久久噜噜噜久久中文字幕色伊伊| 欧美一区二区视频在线观看2020 | 欧美在线视频不卡| 亚洲欧美国产精品va在线观看 | 欧美在线免费一级片| 欧美在线视频免费| 久久er99精品| 久久精品中文字幕免费mv| 久久九九热re6这里有精品| 久久se精品一区精品二区|