• 中國(guó)農(nóng)藥工業(yè)協(xié)會(huì)
  • 金旺智能
  • 中國(guó)農(nóng)藥工業(yè)協(xié)會(huì)
  • 作物123
  • 報(bào)告訂閱咨詢(xún)

數(shù)據(jù)、算法、算力:數(shù)字育種產(chǎn)業(yè)化拐點(diǎn)將至

責(zé)任編輯:左彬彬 來(lái)源:35斗 日期:2024-01-15



“培育出高產(chǎn)、優(yōu)質(zhì)、抗性強(qiáng)的作物品種,這是所有育種家的夢(mèng)想,如果你手里有300份材料,該怎么通過(guò)數(shù)字化手段去實(shí)現(xiàn)它?

 

首屆數(shù)字種業(yè)論壇上,天豐智慧技術(shù)總監(jiān)邢鴻雁博士的這一提問(wèn),引發(fā)了在場(chǎng)聽(tīng)眾的深思……

 

就傳統(tǒng)育種而言,選育動(dòng)植物新品種過(guò)程十分漫長(zhǎng)。一個(gè)植物新品種一般需要8-10年,畜禽新品種甚至要花費(fèi)數(shù)十年乃至上百年。部分育種家努力鉆研半生,最終也沒(méi)有出來(lái)一個(gè)大品種。又或者,新品種選育出來(lái)便已被瞬息萬(wàn)變的市場(chǎng)淘汰,傾注其中的心血不免令人惋惜。

 

眾所周知,種質(zhì)資源是育種的基礎(chǔ),育種家第一步要做的便是“淘金”。截至2022年底,我國(guó)長(zhǎng)期保存的農(nóng)作物種質(zhì)資源數(shù)量已達(dá)53.9萬(wàn)份。保存數(shù)量雖位居世界第二,但作物種質(zhì)資源利用率僅為3.0%~5.0%,有效利用率僅為2.5%~3.0%。

 

種質(zhì)資源的收集、保存、鑒定,所耗人力、時(shí)間和財(cái)力成本巨大,育種家要深入田間地頭做種植材料的鑒定十分困難,盡管他們樂(lè)此不疲。

 

有人將傳統(tǒng)育種比喻為“選美”,育種的最終結(jié)果全靠育種家的眼睛,即便是在大數(shù)據(jù)、人工智能火爆的當(dāng)下,育種家的經(jīng)驗(yàn)仍舊不可取代。

 

可是,面對(duì)一座如此龐大、尚待開(kāi)發(fā)的種質(zhì)資源大山,單靠育種家的一步一履,或難登頂。

 

近年來(lái),“BT+DT”成為了全球育種行業(yè)最熱門(mén)的詞匯。目前,國(guó)外種業(yè)已進(jìn)入“常規(guī)育種+生物技術(shù)+信息化”的育種“4.0時(shí)代”,而我國(guó)仍處在以雜交選育、分子育種為主的“2.0-3.0時(shí)代”。

 

以拜耳、科迪華為代表的國(guó)際種業(yè)巨頭,利用人工智能、機(jī)器學(xué)習(xí)等技術(shù),結(jié)合海量基因組、表型和環(huán)境數(shù)據(jù)的分析,進(jìn)行種子的選擇、優(yōu)化,已紛紛構(gòu)建起成熟的數(shù)字化育種體系。

 

2020年,拜耳在美國(guó)亞利桑那州的馬拉納開(kāi)設(shè)自動(dòng)化溫室,作為其新的全球玉米產(chǎn)品設(shè)計(jì)中心,可整合端到端的數(shù)字化育種過(guò)程,加速其玉米新品種迭代進(jìn)程。

 

在種業(yè)企業(yè)全面擁抱數(shù)字技術(shù)的同時(shí),國(guó)際互聯(lián)網(wǎng)巨頭也在積極布局育種賽道。

 

去年,谷歌的母公司Alphabet公開(kāi)推出“Mineral”,該項(xiàng)目籌劃已久,自2014年來(lái)平均每天可以采集到190000個(gè)農(nóng)田數(shù)據(jù)點(diǎn)。利用這些數(shù)據(jù),Mineral 開(kāi)發(fā)了80個(gè)高性能機(jī)器學(xué)習(xí)模型,幫助企業(yè)、農(nóng)民、研究人員和育種家預(yù)測(cè)作物產(chǎn)量、增加產(chǎn)量、防治害蟲(chóng)和雜草。

 

Google Ventures合伙人Andy Wheeler曾表示,“數(shù)據(jù)將是推動(dòng)下一波農(nóng)業(yè)生產(chǎn)率提高的工具。”

 

再看國(guó)內(nèi),數(shù)字技術(shù)在交通、消費(fèi)、物聯(lián)網(wǎng)等領(lǐng)域已發(fā)展得十分成熟。近些年,阿里、騰訊、京東等互聯(lián)網(wǎng)巨頭在農(nóng)業(yè)賽道頻頻落子??梢哉f(shuō),國(guó)內(nèi)要發(fā)展數(shù)字育種,既是大勢(shì)所趨,也是恰逢其時(shí)。

 

回到開(kāi)篇的提問(wèn),數(shù)字化育種究竟該如何從展望走向落地,從經(jīng)驗(yàn)復(fù)制走向自主研發(fā),乃至成熟的產(chǎn)業(yè)化應(yīng)用呢?最近,35斗參加了首屆數(shù)字種業(yè)論壇,從數(shù)十位專(zhuān)家學(xué)者的報(bào)告和訪(fǎng)談中,我們總結(jié)出了一些可行的方向和答案:


追趕:把握數(shù)字化機(jī)遇,為育種插上隱形翅膀

 

跨界:多元人才涌入,跑好數(shù)字革命的接力棒

 

降維:減少算法和模型內(nèi)卷,卷應(yīng)用贏面更大

 

聯(lián)合:細(xì)致分工與一體化鏈接,重塑行業(yè)生態(tài)

 

標(biāo)準(zhǔn):直面育種數(shù)據(jù)爆炸,回歸育種本質(zhì)邏輯


 

追趕:把握數(shù)字化機(jī)遇,為育種插上隱形翅膀

 數(shù)字2.jpg


發(fā)展數(shù)字育種契合當(dāng)前我國(guó)農(nóng)業(yè)政策和發(fā)展戰(zhàn)略,這是一個(gè)非常好的機(jī)會(huì)。

 

擁有40余年育種經(jīng)驗(yàn)的前亞太種子協(xié)會(huì)(APSA)主席、前先正達(dá)中國(guó)政府事務(wù)總監(jiān)張孟玉表示,我國(guó)的數(shù)字技術(shù)在農(nóng)業(yè)以外的其他行業(yè)發(fā)展迅速并逐步成熟,如無(wú)人機(jī)、無(wú)人交通、物聯(lián)網(wǎng)、區(qū)塊鏈應(yīng)用、供應(yīng)鏈管理等。但在數(shù)字農(nóng)業(yè)和數(shù)字種業(yè)方面,剛剛起步,十分滯后。

 

在有限的應(yīng)用中,設(shè)施農(nóng)業(yè)又占據(jù)了大頭。水肥一體化、溫度光源控制、云平臺(tái)管理等領(lǐng)域常??梢?jiàn)數(shù)字化身影。目前,信息技術(shù)在以跨國(guó)企業(yè)為代表的種業(yè)企業(yè)逐步得到使用,于中國(guó)種業(yè)而言,抓住數(shù)字化機(jī)遇,任重而只爭(zhēng)朝夕。

 

對(duì)此,中國(guó)農(nóng)業(yè)大學(xué)郭偉龍副教授也提出了一個(gè)很有趣的思考:我們常說(shuō)基因組學(xué)已經(jīng)有很多數(shù)據(jù),為什么還要數(shù)字化?數(shù)字化究竟是什么含義?

 

哪怕是數(shù)據(jù)庫(kù)也會(huì)有好幾個(gè)層次,數(shù)據(jù)化和數(shù)字化有著迥異的差距。

 

通過(guò)測(cè)序技術(shù)采集并獲取大量基因組信息,這個(gè)只是數(shù)據(jù)化的過(guò)程。我們真正要做的是數(shù)字化,基于海量基因型、表型和環(huán)境組學(xué)數(shù)據(jù),利用算法、模型形成的育種知識(shí)庫(kù),對(duì)于指導(dǎo)實(shí)踐可能更有價(jià)值、效率。

 

種業(yè)4.0是一個(gè)以數(shù)字化為基礎(chǔ)的創(chuàng)新時(shí)代。

 

華大制造李勇副研究員認(rèn)為,西方國(guó)家之所以發(fā)展起成熟的育種體系,恰恰是其數(shù)字積累起來(lái)的領(lǐng)先優(yōu)勢(shì)。如果傳統(tǒng)的種業(yè)無(wú)法和西方競(jìng)爭(zhēng),那么分子育種和數(shù)字育種將是趕超的絕佳機(jī)會(huì)。我國(guó)種質(zhì)資源豐富,在研發(fā)力量上也逐漸出現(xiàn)了從政府、科研機(jī)構(gòu)到企業(yè)的轉(zhuǎn)變,這是一個(gè)良好的信號(hào)。

 

也許,大數(shù)據(jù)早已在數(shù)字經(jīng)濟(jì)的舞臺(tái)上大展拳腳、屢創(chuàng)佳績(jī)。如今涉足育種領(lǐng)域,它的神秘面紗正在一點(diǎn)一點(diǎn)揭開(kāi),蓄勢(shì)待發(fā)。

 

 

跨界:多元人才涌入,跑好數(shù)字革命的接力棒


 數(shù)字.jpg


育種家的戰(zhàn)場(chǎng),不止于實(shí)驗(yàn)室,也在田野,更在云端。

 

數(shù)字化育種時(shí)代,不僅需要遺傳學(xué)、分子生物學(xué)、生物信息學(xué)等領(lǐng)域的“BT”人才,還迫切需要數(shù)據(jù)科學(xué)、人工智能、物聯(lián)網(wǎng)、自動(dòng)化控制、統(tǒng)計(jì)學(xué)等相關(guān)背景的“DT”人才共同參與。

 

拜耳作物科學(xué)的王林博士提到,種子的產(chǎn)出潛力很關(guān)鍵,要能適應(yīng)不同農(nóng)民、農(nóng)場(chǎng)的種植環(huán)境。育種不僅僅局限于基因組方面的研發(fā),也需要涉及種子“周邊”,如殺蟲(chóng)、除草、種子管理等。因此,拜耳的育種研發(fā)始終是圍繞著客戶(hù)最終的需求來(lái)規(guī)劃。

 

西南民族大學(xué)青藏高原研究院的王嘉博副研究員,其博士研究背景是軟件開(kāi)發(fā)和算法,如今卻在藏區(qū)的牦牛基因組選育工作上干勁十足。

 

在被問(wèn)到如何與老一輩育種家合作,推動(dòng)種業(yè)數(shù)字化轉(zhuǎn)型時(shí),他提到:我父親從事大豆的傳統(tǒng)育種已有30年,也持續(xù)做出了自己的成果。當(dāng)我和他討論現(xiàn)代的分子技術(shù)、數(shù)字技術(shù)時(shí),父親表示“實(shí)踐是最好的答案”。

 

新技術(shù)的出現(xiàn)肯定會(huì)帶來(lái)革命。一代人比一代人要強(qiáng),技術(shù)發(fā)展也會(huì)一代比一代更先進(jìn)。只有深入田間地頭,用數(shù)字技術(shù)真正地推動(dòng)種業(yè)進(jìn)步,才能讓老一輩的人相信:這桿槍交給我們可以放心。

 

中國(guó)農(nóng)科院作物所的張學(xué)勇研究員也在接受訪(fǎng)談時(shí)表示:這次參會(huì)最強(qiáng)烈的感受,就是希望在青年身上。對(duì)我們這一輩的育種家來(lái)說(shuō),田間的數(shù)據(jù)、實(shí)驗(yàn)室的數(shù)據(jù)有很多,但是缺乏海量數(shù)據(jù)的有機(jī)整合。而國(guó)際上的種業(yè)競(jìng)爭(zhēng),其實(shí)就是國(guó)家種質(zhì)資源的智能化競(jìng)爭(zhēng)。

 

或許,當(dāng)新一代育種家接過(guò)這份沉重的“接力棒”時(shí),“彎道超車(chē)”或能更快實(shí)現(xiàn)。


 

降維:減少算法和模型內(nèi)卷,卷應(yīng)用贏面更大

 


數(shù)字3.jpg


在過(guò)去的一年里,以Chat GPT的火爆為標(biāo)志,諸如通義千問(wèn)、文心一言、PaLM 2等生成式人工智能領(lǐng)域的大語(yǔ)言模型紛紛涌現(xiàn)。百度創(chuàng)始人李彥宏曾公開(kāi)表示:模型本身并不直接產(chǎn)生價(jià)值,基于基礎(chǔ)大模型開(kāi)發(fā)出來(lái)的應(yīng)用才是模型存在的意義。

 

郭偉龍副教授認(rèn)為,人工智能技術(shù)從計(jì)算機(jī)領(lǐng)域來(lái)講已經(jīng)很成熟,方法已經(jīng)卷到了一定程度,現(xiàn)在不再卷模型,而是卷應(yīng)用。邢鴻雁博士也提到,對(duì)于數(shù)字育種來(lái)說(shuō),不用去卷算法,哪個(gè)好用就用哪個(gè)。

 

天豐智慧CEO張洪也強(qiáng)調(diào),種業(yè)科技方面我國(guó)的發(fā)期刊數(shù)量處于絕對(duì)領(lǐng)先優(yōu)勢(shì),但從科學(xué)到技術(shù)已經(jīng)出現(xiàn)斷層,從技術(shù)到工程化實(shí)現(xiàn)還有很長(zhǎng)的路要走。

 

構(gòu)建育種大模型可以幫助預(yù)測(cè)和找到優(yōu)勢(shì)的基因,大幅提升育種效率。但是,“有用”一定是決定算法、模型選擇的關(guān)鍵因素。

 

以大豆為例,“中央一號(hào)文件”連續(xù)4年聚焦大豆擴(kuò)種。中國(guó)農(nóng)科院作物所的李英慧研究員表示,利用基因組、轉(zhuǎn)錄組、常規(guī)表型等多組學(xué)技術(shù)的聯(lián)合分析,團(tuán)隊(duì)成功發(fā)掘了300多個(gè)與產(chǎn)量、抗病蟲(chóng)等相關(guān)的基因。

 

然而,解鎖大豆耐密植基因只是第一步,團(tuán)隊(duì)更希望的是,讓這些基因能夠被育種家切實(shí)利用,回應(yīng)大豆高度依賴(lài)進(jìn)口的國(guó)情。

 

正如慧諾瑞德創(chuàng)始人韓志國(guó)所言,表型技術(shù)可以實(shí)現(xiàn)高通量、自動(dòng)化獲取和產(chǎn)量、品質(zhì)、抗性相關(guān)的信息數(shù)據(jù),看上去非常高大上,脫去華麗的外衣就是光譜檢測(cè)技術(shù)。我們思考的是:能否為產(chǎn)業(yè)做一點(diǎn)事?

 

從這個(gè)角度來(lái)看,無(wú)論是極智生物的高通量基因測(cè)序平臺(tái),還是天豐智慧的GS預(yù)測(cè)育種,抑或是慧諾瑞德的高通量表型鑒定,讓技術(shù)更加落地、平臺(tái)更加實(shí)用,或許才是千千萬(wàn)萬(wàn)個(gè)數(shù)字化育種人員的終極夢(mèng)想。

 

 

聯(lián)合:專(zhuān)業(yè)分工與一體化鏈接,重塑行業(yè)生態(tài)


 00.png


在這場(chǎng)數(shù)字化革命中,傳統(tǒng)種企或許才是感觸最深的。

 

去年,來(lái)自紅船啟航地的浙江大禾種業(yè)董事長(zhǎng)朱娟,毅然決然地加入了數(shù)字種業(yè)聯(lián)盟,擁抱數(shù)字化育種,尋求企業(yè)轉(zhuǎn)型。

 

朱娟認(rèn)為,在數(shù)字化育種中,傳統(tǒng)種企更多關(guān)注“效率”,如何精準(zhǔn)地能夠?yàn)榉N業(yè)企業(yè)和農(nóng)民的增收增效服務(wù),這是企業(yè)最關(guān)注的點(diǎn)。數(shù)字種業(yè)聯(lián)盟的成立,有望實(shí)現(xiàn)種業(yè)企業(yè)、科研單位從點(diǎn)到線(xiàn)的有機(jī)鏈接,對(duì)于加速傳統(tǒng)種企業(yè)加速品種迭代會(huì)起到至關(guān)重要的推動(dòng)作用。

 

中國(guó)農(nóng)科院作科所/國(guó)家南繁研究院張學(xué)才研究員對(duì)此的思考是:提高育種過(guò)程的效率,而不僅僅是單一技術(shù)的效率。要解決好種質(zhì)、算法和育種實(shí)踐的結(jié)合問(wèn)題,從種到收、從選品種到測(cè)序,每個(gè)過(guò)程、環(huán)節(jié)都需要數(shù)字化賦能。

 

李勇研究員也表示,數(shù)字育種的價(jià)值鏈很長(zhǎng),而行業(yè)的專(zhuān)業(yè)化服務(wù)遠(yuǎn)遠(yuǎn)不夠,這也是我們強(qiáng)調(diào)的數(shù)字化聯(lián)盟的重要性所在。

 

合肥智能育種加速器大科學(xué)裝置(海霸設(shè)施)首席科學(xué)家吳麗芳強(qiáng)調(diào),通過(guò)平臺(tái)將各環(huán)節(jié)的數(shù)據(jù)、技術(shù)和設(shè)備進(jìn)行整合,為育種家提供便利是大科學(xué)裝置的創(chuàng)立初衷。

 

我們不需要做重復(fù)的工作,要充分利用各方資源,合作共贏。未來(lái),在種質(zhì)創(chuàng)新、新基因快速挖掘、知識(shí)產(chǎn)權(quán)保護(hù)、核心種質(zhì)資源數(shù)據(jù)共享等方面,大家有很多合作空間。

 

在國(guó)家種業(yè)振興大背景下,如何將行業(yè)內(nèi)好的育種技術(shù)真正落地,做到產(chǎn)業(yè)化應(yīng)用非常關(guān)鍵。

 

極智基因創(chuàng)始人焦成智表示,單打獨(dú)斗非常難,通過(guò)組建聯(lián)盟,把各方先進(jìn)的育種技術(shù)進(jìn)行整合,真正賦能下游的新品種培育、種質(zhì)的創(chuàng)新,甚至未來(lái)農(nóng)業(yè)食品加工等一系列的產(chǎn)業(yè)應(yīng)用。

 

 

標(biāo)準(zhǔn):直面育種數(shù)據(jù)爆炸,回歸育種本質(zhì)邏輯



000.jpg


當(dāng)前,全球正處于“數(shù)據(jù)爆炸”時(shí)代。

 

2022年我國(guó)數(shù)據(jù)產(chǎn)量達(dá)8.1ZB,同比增長(zhǎng)22.7%,全球占比達(dá)10.5%,位居世界第二。其中,農(nóng)業(yè)數(shù)據(jù)的增量更是達(dá)到了50%至80%的水平。在環(huán)境氣候、基因組測(cè)序、作物生長(zhǎng)指標(biāo)、地方統(tǒng)計(jì)等方面,種業(yè)從來(lái)不差數(shù)據(jù)。

 

在會(huì)議現(xiàn)場(chǎng),張學(xué)才提出了一個(gè)有趣的觀(guān)點(diǎn):“數(shù)據(jù)并不是越多越好”。

 

他提到,測(cè)序數(shù)據(jù)越多越好,標(biāo)記數(shù)量則不一定越多越好,算法也不一定越高級(jí)越好。對(duì)育種的人來(lái)講,數(shù)據(jù)庫(kù)能否承受存儲(chǔ)和計(jì)算的壓力,讓人覺(jué)得你不是在玩數(shù)據(jù),你是來(lái)實(shí)踐做育種,這才是最重要的。

 

每天都有源源不斷的數(shù)據(jù)產(chǎn)生,在某些方面,也給育種家造成了困擾。

 

韓志國(guó)表示,大家在做表型采集時(shí)常常有不同的命名方式,這給大數(shù)據(jù)處理增加了難度。同時(shí),不同的表型平臺(tái)的信息化難以打通,很重要的一點(diǎn)在于表型的數(shù)據(jù)實(shí)在太大。

 

我們也一直在尋找表型數(shù)據(jù)領(lǐng)域更簡(jiǎn)化的指標(biāo),從而助力育種和關(guān)鍵的種植流程決策連接起來(lái),這個(gè)或許會(huì)成為產(chǎn)業(yè)化落地應(yīng)用的關(guān)鍵點(diǎn)。

 

張學(xué)才強(qiáng)調(diào),育種是一個(gè)龐雜的過(guò)程,其中牽扯到標(biāo)準(zhǔn)化和系統(tǒng)化問(wèn)題。包括命名格式的統(tǒng)一、流程的優(yōu)化、頂層設(shè)計(jì)的完善,都需要遵循科學(xué)性原則。當(dāng)每一粒種子有了清晰的ID,包括來(lái)源、年份、名稱(chēng)等;當(dāng)每家育種信息系統(tǒng)的底層框架達(dá)成一致,數(shù)字育種才能真正成型。

 

到那時(shí),再?gòu)?fù)雜的數(shù)據(jù)輸入和輸出也會(huì)變得簡(jiǎn)單、高效。

 

 

寫(xiě)在最后

 種子.jpg


作物育種猶如建房子,正在由“建平房時(shí)代”進(jìn)入“建高樓時(shí)代”。雖然平房和高樓其房間的功能變化不大,但其建設(shè)的流程和工藝已有天壤之別。

 

未來(lái)的育種,將是“設(shè)計(jì)育種”,需要有科學(xué)的規(guī)劃,優(yōu)良的設(shè)計(jì),精細(xì)的施工,完善的監(jiān)理,嚴(yán)密的檢測(cè),出色的管理,高效的協(xié)作,缺一不可。

 

這兩段話(huà)由我國(guó)著名水稻育種家劉定富老師所說(shuō)。今天,它也出現(xiàn)在了由極智生物、天豐智慧、慧諾瑞德三家企業(yè)共同發(fā)起的數(shù)字種業(yè)聯(lián)盟的規(guī)劃書(shū)上。這些文字正是關(guān)于聯(lián)盟成立初衷、所追求事業(yè)最為形象與深刻的說(shuō)明。

 

未來(lái),在聯(lián)盟的助力下,我們也期望一代又一代育種家的終極夢(mèng)想能從紙面躍至現(xiàn)實(shí)。

中國(guó)農(nóng)藥工業(yè)網(wǎng) 版權(quán)所有

地址:北京市朝陽(yáng)區(qū)農(nóng)展館南里通廣大廈7層

電話(huà):010-84885233 京公網(wǎng)安備11010502025163