AI將在多大程度上重塑科學研究(AI for Science)?這是沁言學術CEO羅實一直在思考的問題。
2024年的諾貝爾化學獎頒給了利用AI模型輔助研究的科學家,這一標志性事件讓“AI科研”徹底出圈。而早在風口來臨之前,羅實及其團隊就已扎進這一賽道。作為一名畢業于清華大學的互聯網連續創業者,羅實從技術變革中嗅到了商業機會。
“傳統科研中,文獻檢索、引用插入、格式調整等機械性工作占據了學者大量時間,我們希望把他們從繁瑣中解放出來。”近日羅實在接受時代周報記者專訪時直言,沁言學術的目標并非做一個簡單的效率工具,而是打造一個真正懂科研邏輯、能輔助深度思考的“學術超級智能體”。
在他看來,國內外已陸續出現類似產品,現在已處于學術智能體爆發的前夜。無論是深勢科技等硬科技企業的持續加碼,還是各類新興產品的跟進,都標志著“AI賦能科研”正在從共識走向競爭。而在羅實眼中,這并非一場零和博弈,不同技術路線的產品將在龐大的科研生態中找到各自的土壤,而沁言學術要做的,就是守住“深耕科研場景”這一高地。
2025年6月,沁言學術由其經典產品“邊寫邊搜”完成品牌迭代,核心團隊匯聚了CSSCI創始人、清華學霸及互聯網大廠極客,產品已服務超20萬C端科研用戶。
業內人士普遍認為,AI將重塑傳統的學術研究范式。毫無疑問,這是一項野心勃勃的計劃。“我們的產品定位,并不是要取代學術人群,而是希望為他們提質增效,為每名學者提供專屬的AI研究伙伴。”羅實表示,沁言學術并不是幫助用戶直接寫一篇論文,然后拿去投稿,“我們嚴守學術倫理底線,不幫用戶‘寫’論文,而是構建一個專屬的AI科研伙伴。”
行業格局:“真正的巨頭尚未成型”
時代周報:沁言學術目前發展情況如何?
羅實:現在核心團隊有30多人,幾名發起人包括CSSCI創建者蘇新寧教授都是長期深耕學術領域的專家;產研團隊則來自清華大學、悉尼大學、北卡羅來納州立大學、華南理工等名校,擁有華為、阿里、小米等大廠的實戰背景,在產品創新和落地方面經驗深厚。從去年起,我們針對AI在學術領域的落地做了大量探索。現在主推的“學術超級智能體”,正處在市場推廣階段。
時代周報:公司之前有“邊寫邊搜”這款產品,也是幫助用戶解決學術流程問題。學術智能體和它有什么區別?
羅實:“邊寫邊搜”可以理解為沁言學術的1.0版本,這是一款相對比較傳統的工具,提供文獻管理或文獻閱讀等功能,為我們積累了高質量的學術數據資源。而現在的“學術智能體”是用AI重構了整個科研工作流——從最上游的AI輔助選題,到中游的知識庫構建,再到下游的寫作輔助。以前我們是給學術工作者一把好用的鏟子,現在我們是提供了一個智能化的施工團隊。
時代周報:不少通用大模型也可以輔助學術寫作。和它們相比,沁言學術有什么不同?
羅實:通用大模型最大的問題是“學術幻覺”,它可能會一本正經地胡說八道。而我們的核心壁壘在于“私有知識庫+精準溯源”。這個知識庫可以把用戶研究方向收集而來的文獻,以及閱讀文獻時做的摘要筆記融合起來。當需要生成一個大綱或內容時,可根據這些已驗證過的文獻、筆記,快速輸出結果。
我們的生成是“基于證據”的(Evidence-based),每一句話、每一個觀點都能精準錨定到具體的文獻來源——摘要、作者、年份一目了然。這種嚴謹性是通用模型無法比擬的。此外,相比通用模型的整篇生成,我們輔助寫作提供的是顆粒度更細的“局部優化”,讓學者擁有更多掌控權。
產品邏輯:“讓AI處理信息,讓人類處理思想”
時代周報:寫論文時,文獻引用也是工作量很大的環節,沁言學術怎么解決這個問題?
羅實:我們的輔助寫作功能,確實希望在這方面幫到用戶。
比如一篇博士論文,通常需要上百個文獻引用來支撐核心觀點。這是一個很繁瑣的工作。
沁言學術可以把用戶搜集的文獻存到知識庫,通過知識庫與寫作流程的打通,能自動匹配觀點與文獻,將原本需要一兩天的工作壓縮至5分鐘。我們不是在炫技,而是在通過極致的效率提升,讓學者將寶貴的時間投入到更有價值的創造性工作中。
時代周報:行業里其他的學術智能體,能不能做到這些?
羅實:現在針對科研領域的AI應用不少,國外有一些月活達到幾百萬量級的產品,國內也有不少入局者,但大多局限在文獻檢索或單純的對話生成等單一環節。能真正打通“檢索-閱讀-管理-寫作”全鏈路,且達到一定用戶量級的產品,目前國內尚未形成頭部壟斷的產品。賽道的終局遠未到來,這正是沁言學術的戰略機遇窗口。我們要做的是全流程的生態覆蓋,而非單點的工具修補。
時代周報:對用戶來說,能一站式解決問題的產品當然要便捷得多。
羅實:是的。比如寫一篇論文,在傳統的文獻檢索方式下,用戶需要用不同的關鍵詞去不同的數據庫檢索,如知網、萬方和Google Scholar等。檢索之后,要從幾百篇當中做初步篩選,最終集中到幾十篇。
然后再做精讀,而后再篩選。到了寫作環節,還要不停重復檢索。如果只針對某個環節做產品,這是不夠的。
時代周報:沁言學術的學術智能體,怎么把這一過程簡化?
羅實:你可以把需求——也就是模糊的研究意圖,一次性都告訴學術智能體。比如“近五年某領域某學者的研究綜述”。智能體不僅能自動檢索篩選,下載至AI云盤,還能自動完成預讀和摘要。
接下來的精讀,如果使用ChatGPT等通用大模型去讀,那要一篇篇把文獻丟給它。但打開沁言學術的AI云盤,下載的文獻會自動完成大致閱讀和概括,甚至還會提出一些研究問題的建議。你可以快速就某篇論文展開對話,智能體還能夠結合云盤里的其他文獻來回答問題。
總之,你用這個智能體的時間越久,智能體積累你的研究和思考越多。準確地說,它構建的是屬于你的“科研第二大腦”。在這個“外腦”里,它利用通用的邏輯分析能力結合你專屬知識庫,幫你把那些費時費力找資料、讀文獻的工作都做好,讓你能騰出手來,專注于最核心的深度思考,更高效地完成個性化研究。
時代周報:有更多的數據去訓練,智能體的表現會更好?
羅實:想讓一個大模型的回答更專業,其實有兩種方式。一種是訓練,通過構造足夠好的數據集,基于這個數據集去做訓練,把外部知識逐漸內化。第二種像沁言學術的產品,是基于知識庫,結合運用上下文信息和各種工具達到目標。
這是一個基于RAG(檢索增強生成)的復合流程:系統會率先穿透用戶的私有知識庫,并實時聚合全網最新的學術數據庫信息,經結構化清洗后投喂給大模型,最終生成高置信度的答案。
時代周報:沁言學術智能體使用的哪一款底層大模型?
羅實:目前我們的底層大模型,集成了市面上主流大模型的功能,國內和國外的都有。每個大模型的特點不同,智能體綜合了它們的優點,比如有的擅長偏創意的創作,有的多模態處理能力強,有的在長文寫作上表現更好,有的推理能力更強。我們會做一個融合。
技術與倫理:“底線是不觸碰學術不端”
時代周報:按沁言學術的產品邏輯,專業知識庫非常重要,它是如何構建的?
羅實:準確地說,應該是私有知識庫。
學術人群的文獻管理會涉及很多文獻,他們還會做摘錄和筆記。比如我們有個用戶,他做了大概5000多條筆記。按傳統的學術研究方式,可能需要用戶去打上各種各樣的標簽,方便使用時檢索。但我們的知識庫,是把知識切片放到一個數據庫里面。當用戶對話時,會自動檢索與上下文語義類似的內容并輸出答案。這就相當于為他建設了一個私有知識庫。
另外,我們正開發一個“知識廣場”的功能,行業專家可以選擇共享知識。用戶在輔助寫作過程中,就可以把別人的知識庫掛載到自己的對話中來。
時代周報:沁言學術是否考慮自己做一個官方知識庫?
羅實:學術領域細分方向很多,我們自己真正專業和深入了解的,是計算機或AI相關領域。這方面的知識庫可能會做。
不過,針對完全不熟悉的領域,就需要與外部合作,比如學校、醫院或者科研機構。我認為,無論建私有知識庫還是公共知識庫,前提是做好底層的基礎設施。這套東西是都需要的。
時代周報:上面提到訪問外部數據庫,可以全文下載文獻嗎,有沒有版權風險?
羅實:我們目前對接的外部數據庫,是偏公域和開源的類型。比如通過某些平臺下載文獻,是沒有版權問題的。我們正與國內多家主流學術數據庫推進商業授權合作,致力于在合規框架下為用戶提供文獻獲取服務。
用戶在使用我們的智能體時,下載付費文獻會扣除相應的“沁點”,也就是內部“貨幣”。沁言學術再和外部數據庫按比例分成。
時代周報:做學術智能體,通常會調用各種外部工具,這方面進展如何?
羅實:我覺得一個很大的挑戰是,智能體在接到一項任務時,需要準確理解用戶意圖和工具本身可提供的服務,就是意圖和能力之間的匹配。大模型和工具之間的連接,需要不斷完善。
除此之外,我們考慮把一部分構建工具的能力,交給第三方去做。因為學術領域很廣,不太可能覆蓋所有領域,僅靠自己是不行的。第三方搭建工具平臺或插件平臺,我們做好接入,供智能體做任務過程中去調用。這有助于解決智能體對不同領域的工具調用問題。
時代周報:提到不同學術領域,是不是涉及到很多公式或圖表的學科,學術智能體應對起來更麻煩一些?
羅實: 我們需要把學科分為兩類來看。對于數學、理論物理這類“數據密集型”或“文獻密集型”學科,通用大模型通過概率預測機制(Next Token Prediction),已經能很好地處理復雜的公式推導和邏輯驗證,這部分能力進化極快。
真正的挑戰在于那些強實驗性的學科,也就是我們常說的“濕實驗”。目前的瓶頸在于數字智能與物理世界的鴻溝尚未完全填平。雖然AI暫時無法替科學家拿起試管做實驗,但我們正在做的是——讓AI成為實驗設計的“參謀長”。它可以在實驗前進行海量模擬推演,篩選出成功率最高的方案,從而極大地降低實驗試錯的成本。這是目前AI對實驗學科最大的價值。
商業與未來:從文字到多模態
時代周報:學術智能體是否存在一定的學術倫理的風險?
羅實:這是一個原則性問題。我們的核心價值觀是 “反學術不端,做科研增效”。我們嚴守一條紅線——絕不提供“輸入標題直接生成論文”的服務。
我們將產品嚴格定位在“副駕駛”的位置。我們負責處理“寫作前”的信息搜集和“寫作后”的格式潤色,因為這些環節屬于“低創造性勞動”;而論文的核心觀點、創新方法論等“高創造性勞動”,必須且只能由學者本人完成。AI是來輔助駕駛的,方向盤必須始終握在人手里。
時代周報:那怎么考慮數據隱私和安全問題?
羅實:這是很重要的一個問題。我們會在技術層面做加密和隔離,用戶把云端的數據放在我們數據庫之后,即使物理介質被盜走,也無法直接讀取。而且,每個用戶的訪問權限都有嚴格的機制。我們也不會拿用戶的數據去做訓練,這是底線。
時代周報:現在用戶拓展有沒有新進展?
羅實:我們C端的注冊用戶有20多萬,通過這些科研用戶的實戰驗證,目前正在將這套成熟的產品拓展到B端市場,比如和一些大學、醫院或期刊雜志推進合作。沁言學術的商業模式,是訂閱和Token付費相結合,用戶可以根據自身需求去購買不同的服務方案。
時代周報:對于服務用戶人群的設想是什么樣的?
羅實:我們的核心用戶是深耕學術和科研一線的專業群體,包括高校師生、科研人員、醫務工作者以及一些企業研發團隊。這些人群很多時候創造的價值比較大,因此對能帶來提效的工具,付費意愿通常比較強。這種類互聯網產品,核心還是看產品體驗,如果能超出用戶預期,他們還是很認可的。最近,沁言學術在科教重鎮湖南長沙落地,長沙作為中部的科教重鎮,擁有深厚的學術資源與算力產業基礎。我們將研發運營中心落地于此,意在打造‘產學研用’的閉環示范基地。
時代周報:目前公司能不能做到收支平衡?
羅實:公司目前的現金流健康,整體經營狀況實際上已經接近收支平衡的臨界點。接下來,我們將重點發力B端,與高校、醫院及期刊機構深度合作。
時代周報:下一步還有什么產品計劃?
羅實:下一步,我們的核心發力點是多模態技術。學術科研工作從來不只是文字處理,圖表、公式、數據也是信息密度很高的地方。所以,我們要突破純文本的限制,幫用戶解決流程圖繪制、數據圖表生成這些最耗時的痛點,成為科研人員真正的“第二大腦”。
時代周報:針對海外市場的計劃是什么?
羅實:海外市場可能會是完全獨立的一個產品。我們考慮把一部分現有功能拆出來,部署到海外市場獨立運營。因為中英文學術環境差異巨大,不僅是語言問題,更涉及到引用規范、版權體系以及用戶交互習慣的根本不同。我們需要用更本土化的產品邏輯去參與全球競爭。
本文鏈接:http://m.www897cc.com/showinfo-16-186988-0.html拒絕做“論文槍手”,專訪沁言學術CEO羅實:為科學家構建“科研第二大腦”
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com