福利一区二区三区视频在线观看|日韩国产在线一区二区三区|亚洲日韩一级在线毛|日韩亚洲av人人夜夜澡人人爽

  • 
    
  • <dd id="uaegc"><s id="uaegc"></s></dd>
    <ul id="uaegc"></ul><dfn id="uaegc"><source id="uaegc"></source></dfn>
    深圳信息港

    天天短訊!ChatGPT引爆「向量數(shù)據(jù)庫」賽道!兩家公司共獲10億元融資

    2023-05-01 11:46:47 來源:AIGC開放社區(qū)

    4月22日,向量數(shù)據(jù)庫平臺(vector database)Weaviate宣布獲得5000萬美元(約3.5億元)B輪融資,由Index Ventures領(lǐng)投,Battery Ventures等跟投。

    4月28日,向量數(shù)據(jù)庫平臺Pinecone宣布獲得1億美元(約7億元)B輪融資,由Andreessen Horowitz領(lǐng)投,ICONIQ Growth等跟投。


    【資料圖】

    最近,為ChatGPT等生成式AI應(yīng)用提供向量搜索、向量數(shù)據(jù)存儲、向量嵌入等功能的向量數(shù)據(jù)庫賽道突然走紅,兩家初創(chuàng)公司Pinecone和Weaviate的融資時間僅間隔6天,其火爆程度可見一斑。

    Pinecone聯(lián)合創(chuàng)始人兼首席執(zhí)行官Edo Liberty則直言,如果沒有ChatGPT的出現(xiàn),我們根本不可能獲得巨額融資。

    事實上,在ChatGPT火爆出圈之前向量數(shù)據(jù)庫非常小眾,而Pinecone和Weaviate皆創(chuàng)立于2019年無論是融資還是營收并不如意,因為,大型科技巨頭具備自研能力無需使用第三方產(chǎn)品,例如,微軟將向量搜索技術(shù)應(yīng)用在Bing中。

    現(xiàn)在,大量開發(fā)者涌向生成式AI應(yīng)用開發(fā)領(lǐng)域,這使得蟄伏4年的兩家向量數(shù)據(jù)庫廠商終于迎來了曙光,其用戶數(shù)量呈指數(shù)級增長,也是獲得巨額投資的重要原因之一。

    Pinecone融資信息

    當(dāng)創(chuàng)業(yè)者的目光聚焦在類ChatGPT大語言模型、應(yīng)用、衍生產(chǎn)品時,為其提供“后勤服務(wù)”的向量數(shù)據(jù)庫拓寬了生成式AI細分創(chuàng)業(yè)賽道,并成為下一代生成式AI應(yīng)用的主要數(shù)據(jù)庫存儲。

    不過,目前向量數(shù)據(jù)庫存儲只有大型科技巨頭才能使用,而Pinecone和Weaviate希望簡化使用流程降低成本,使得中小型企業(yè)、個人開發(fā)者也能使用向量數(shù)據(jù)庫。

    此外,根據(jù) IDC調(diào)查數(shù)據(jù)顯示,全球在AI技術(shù)和服務(wù)上的支出2023年將達到1540億美元,到2026年將超過3000億美元。其中,向量數(shù)據(jù)庫為AI的開發(fā)、增強內(nèi)容生成的準確性提供了重要技術(shù)支撐。

    下面「AIGC開放社區(qū)」將為大家介紹向量數(shù)據(jù)庫技術(shù)概念、與ChatGPT等大語言模型的關(guān)系、技術(shù)特征、場景化落地以及Pinecone和Weaviate這兩家典型廠商的介紹。

    Weaviate融資信息

    什么是向量數(shù)據(jù)庫

    筆者查詢了國外大量權(quán)威的論文、專業(yè)技術(shù)網(wǎng)站,甚至詢問了ChatGPT,它們對向量數(shù)據(jù)庫的技術(shù)概念解釋非常復(fù)雜難以理解。所以,就用通俗易懂的方式為大家介紹向量數(shù)據(jù)庫概念。

    微軟官方對向量數(shù)據(jù)庫的解讀

    簡單來說,向量數(shù)據(jù)庫用來存儲非結(jié)構(gòu)化數(shù)據(jù),例如,文檔、圖片、視頻、音頻和純文本等,在保證100%信息完整的情況下,通過向量嵌入函數(shù)來精準描寫這些非結(jié)構(gòu)化數(shù)據(jù)的特征,從而提供查詢、刪除、修改、元數(shù)據(jù)過濾等操作。而像SQL、Mysql這樣傳統(tǒng)的數(shù)據(jù)庫根本無法完成這些操作。

    從向量數(shù)據(jù)庫的技術(shù)特性不難看出,這是專門為ChatGPT等生成式AI應(yīng)用量身定制,例如,讓ChatGPT用莎士比亞的語氣生成一段詩句,ChatGPT通過向量數(shù)據(jù)庫的相似搜索功能,可以增強內(nèi)容輸出的準確性。

    因此,向量數(shù)據(jù)庫在大語言模型、計算機視覺、推薦系統(tǒng)以及其他需要語義理解和數(shù)據(jù)匹配的領(lǐng)域得到廣泛應(yīng)用。

    向量數(shù)據(jù)庫主要功能和用例

    向量數(shù)據(jù)庫除了存儲數(shù)據(jù)之外,還提供了語義搜索、圖像/音頻/視頻/等非結(jié)構(gòu)化數(shù)據(jù)相似度搜索、排名和推薦引擎、支持大規(guī)模數(shù)據(jù)、索引與壓縮技術(shù)、分布式架構(gòu)等功能。

    語義搜索:通常搜索文本和文檔可以用兩種方式完成,詞法搜索和精準的單詞或字符串匹配。向量數(shù)據(jù)庫的語義搜索可以理解文本、句子和整個文檔字符串的含義和上下文,從而提供更準確和相關(guān)的搜索結(jié)果。

    圖像/音頻/視頻/等非結(jié)構(gòu)化數(shù)據(jù)相似度搜索:圖像、音頻、視頻和其他非結(jié)構(gòu)化數(shù)據(jù)集,在傳統(tǒng)數(shù)據(jù)庫中進行分類存儲非常具有挑戰(zhàn)性,通常需要將關(guān)鍵字、描述和元數(shù)據(jù)手動應(yīng)用于每個對象。

    向量數(shù)據(jù)庫的相似性搜索功能,如余弦相似性、歐氏距離等度量來衡量向量間的相似性。這使得用戶在處理如圖像識別、推薦系統(tǒng)等變得非常高效。

    排名和推薦引擎:該功能對于電商、搜索引擎來說非常有用,例如,微軟的Bing,網(wǎng)易云音樂的推薦都應(yīng)用了該技術(shù)。該功能主要基于用戶最近匹配項查找相似項目,使向量數(shù)據(jù)庫為用戶提供相關(guān)的最佳內(nèi)容選擇,并且可以根據(jù)相似性分數(shù)對項目進行排名。

    支持大規(guī)模數(shù)據(jù):向量數(shù)據(jù)庫具有良好的擴展性,能夠支持大規(guī)模的向量數(shù)據(jù)存儲和檢索。這對于處理海量數(shù)據(jù)的大語言模型、機器學(xué)習(xí)、數(shù)據(jù)科研等非常有用。

    索引與壓縮技術(shù):為了提高搜索速度和降低存儲成本,向量數(shù)據(jù)庫通常采用先進的索引和壓縮技術(shù)。這些技術(shù)可以有效地降低數(shù)據(jù)的存儲空間,提高查詢速度,并降低內(nèi)存占用。

    分布式架構(gòu):為了實現(xiàn)高可用性和容錯能力,向量數(shù)據(jù)庫采用分布式架構(gòu)。這使得用戶可以在多個計算節(jié)點上分布存儲和處理數(shù)據(jù),提高系統(tǒng)的整體性能。

    Pinecone和Weaviate簡單介紹

    根據(jù)公開資料顯示,Pinecone創(chuàng)立于2019年總部位于美國紐約,主要提供向量數(shù)據(jù)庫服務(wù)。Pinecone曾在2021年1月27日,獲得1000萬美元種子輪融資;2022年3月29日獲得2800萬美元A輪融資。開發(fā)者通過API就能輕松將向量搜索功能添加到應(yīng)用程序中。官網(wǎng)地址:https://www.pinecone.io/

    Weaviate創(chuàng)立于2019年總部位于荷蘭阿姆斯特丹,是一家開源向量數(shù)據(jù)庫服務(wù)商。Weaviate主要提供的服務(wù)包括:向量搜索、混合搜索、生成搜索等服務(wù)。開源地址:https://github.com/weaviate/weaviate

    ,時長02:37

    (文章來源:AIGC開放社區(qū))

    關(guān)鍵詞:

    熱門推薦