《中國科學技術信息研究所:2023學術出版中AIGC使用邊界指南(12頁).pdf》由會員分享,可在線閱讀,更多相關《中國科學技術信息研究所:2023學術出版中AIGC使用邊界指南(12頁).pdf(12頁珍藏版)》請在三個皮匠報告上搜索。
1、使用邊界指南Guideline on the Boundariesof AIGC Usage in Academic Publishing學術出版中中國科學技術信息研究所愛思唯爾、施普林格自然、約翰威立國際出版集團(排名不分先后)我很高興看到中信所聯合愛思唯爾、約翰威立、施普林格自然等國際出版機構制定本指南。這份指南為論文作者、研究機構、學術期刊出版單位等如何負責任地使用AIGC提出了建議,包括如何對AIGC使用情況進行充分、正確的披露和聲明。因為AIGC的使用是一個非常動態的領域,STM也希望各方獻計獻策以適應未來。在現階段本指南是務實且有作用的。顏帥(國際科學、技術與醫學出版商協會中國顧問
2、)隨著生成式人工智能在關注度和使用上的加速發展,施普林格自然很高興參與制定關于這一重要課題的指南。由于該技術功能強大,我們需要去理解預期和非預期的后果,并因此謹慎小心地行事。同樣需要注意的是,鑒于該技術的迭代特性,這份指南也是迭代的,將隨著該技術本身的發展,包括與之相關的挑戰和益處,而持續發展。Steven Inchcoombe(施普林格自然科研總裁)生成式人工智能(Generative AI)為未來科學研究和學術出版帶來了廣闊的前景和機遇。然而,鑒于其迅猛的發展速度,我們需要展開深入的探討和對話,以解決從科研到出版過程中各個利益相關方應如何在確保誠信和透明原則下運用這項技術的問題。在這個背景
3、下,這份指南對于提高人們對使用這項新技術所涉及問題的認識非常重要,同時也強調了人工智能技術在實際應用中問責制的重要性。Michael Streeter(約翰威立國際出版集團科研誠信政策與戰略總監)愛思唯爾非常歡迎由中國科學技術信息研究所(ISTIC)牽頭的這一重要倡議,即制定在學術出版中AIGC技術的使用指南。我們很高興有機會為該技術使用指南做出貢獻,并分享我們自己的經驗。正如指南中所指出的,人工智能在學術和學術出版領域的影響與日俱增,同時也帶來了機遇和挑戰。愛思唯爾的政策側重于負責任地使用人工智能,以及在作者使用人工智能協助其文章寫作過程時披露相關信息的必要性,同時我們的政策強調在審稿人和編
4、輯使用人工智能時保護作者和數據的保密性和隱私權。在所有情況下,我們都需要為作者、讀者、審稿人、編輯和投稿人提供透明度和指導。ISTIC的這份指南是非常關鍵的,它將有助于學界以負責任的、透明的和可問責的方式來使用人工智能。Sarah Jenkins(愛思唯爾研究誠信與出版倫理部總監)目錄1 背景 012 目標 022.1 防范學術不端,加強誠信治理 022.2 引導相關利益主體就AIGC使用達成共識 023 原則 023.1 透明度和問責制 023.2 質量和誠信 023.3 隱私和安全 023.4 公平 033.5 可持續發展 034 行為框架/實踐指導 034.1 研究開展和論文撰寫階段 0
5、34.1.1 資料收集 034.1.2 統計分析 044.1.3 圖表制作 044.1.4 文字撰寫 044.1.5 語言和潤色 054.1.6 引文整理 054.2 投稿階段 054.2.1 作者署名 054.2.2 規范引用 054.2.3 披露和聲明 054.2.4 同行評審 064.3 論文發表/出版后 064.3.1 數據倉儲和共享 064.3.2 AIGC相關材料提交、存檔 064.3.3 AIGC產生內容的檢測和發現 065 總結 076 致謝 08學術出版中AIGC使用邊界指南背景01在使用AIGC時應尊重隱私和數據保護,包括數據、隱私和安全影響評估,并通過適當的數據匿名來保護
6、隱私、數據保護和安全措施來確保數據安全。3.4 公平使用AIGC時應秉持公平原則,避免偏見。由于人工智能具有復制和放大偏差的風險,因此在訓練數據選擇、算法設計、模型生成和優化、使用過程中,應仔細評估和審查潛在的偏差來源,并建立反饋機制,監測和審查可能的不公平現象,及時糾偏。同時,AIGC能夠幫助提供諸如語言潤色等服務,減少此類文化或語言上的不公平現象。3.5 可持續發展AI系統的多學科性質使其非常適合解決全球關注的領域,如聯合國可持續發展目標、碳中和等。它還為公共和私營組織提供了提高效率的機會,以實現更大的生態可持續性和責任。AI系統承載著造福全人類,包括子孫后代的承諾。為高質量輸入數據的供應
7、商提供資金和其他獎勵措施,如出版商創建的出版物和數據庫,有助于提取重要的可采取行動的知識??沙掷m發展應是AIGC本身的核心原則。為減少重復和浪費,使用AIGC應避免過度依賴可能暫時或永久不可用的數據,同時工具的功能模塊應基于公認標準和指南,以確保數據可查找、可訪問、可互操作和可重復使用。近年來,隨著人工智能技術的迅速發展,特別是2022年11月人工智能聊天機器人ChatGPT的發布,人工智能內容生成(Artificial Intelligence Generated Content,簡稱AIGC)已經走進公眾視野,并被廣泛利用。人們清楚地認識到人工智能(AI)正在獲得產生流利語言的能力,產生的
8、大量語句越來越難與人寫的文本區分開來。一些科學家已經在使用聊天機器人作為研究助手,幫助其組織思維,對他們的工作產生反饋,協助其編寫代碼并總結研究文獻。AI在研究論文寫作、創作等方面的影響不斷增強,但是對學術研究的透明性、完整性產生重要影響,引起學術界的廣泛關注。學術界最擔憂的是科學家、研究人員、學生等可能會欺騙性地將AIGC生成的文本作為自己的文本,或者簡單使用AIGC并產生不可靠的研究成果。LLMs(Large Language Models)通過學習大量在線文本數據庫中的語言統計模式來工作,很容易產生錯誤和誤導性信息,且無法顯示其信息的來源。如果沒有輸出控制,AIGC很容易被用來產生不當言
9、論或不可靠的研究結果,影響科研生態環境。同時,使用AIGC還可能增加學術不端檢測的難度(例如抄襲和圖像操縱檢測)。因此,如何使用AIGC,設定界限并提供可參考的指南至關重要。目前,一些國家科技管理機構、出版領域、期刊等針對AI技術在學術論文中的使用進行了研討,并提供了一些相關的準則、指南等,例如國際出版倫理道德委員會(COPE),國際醫學期刊編輯委員會(ICMJE),國際科學、技術和醫學出版商協會(STM),Taylor&Francis,Wiley,Springer Nature,Elsevier等。值得注意的是,不同機構在不同時期發布的AI相關指南和規范性文件,有著不同的表述和要求。為此,在
10、廣泛調研和梳理現有業內相關研究和探索工作的基礎上,我們致力于為AI技術在學術出版中的最佳行為實踐提供一個基本原則的框架和指南,希望能夠引導出版界、科學界和科技管理部門就AI技術使用規范進一步形成共識。因為AI是一項新興技術,技術的性質及如何使用將不可避免地發生變化,我們將根據情況變化,持續、及時更新這份指南。背景1022.1 防范學術不端,加強誠信治理以防范AIGC不當使用作為切入點,加強科研誠信意識教育,推進學術誠信治理,推進科研活動有序開展。2.2 引導相關利益主體就AIGC使用達成共識明晰相關利益主體在學術期刊論文準備、寫作、投稿、評審、出版、傳播各環節應該履行的最佳行為實踐,提供詳盡、
11、規范的AIGC使用指導。3.1 透明度和問責制透明度和問責制是學術出版中AIGC使用最基本的原則。在學術研究到出版發行的過程中,所有參與者(包括研究人員、作者、同行評議人和讀者)都應該了解并明確披露AIGC的使用情況,透明度應該包括數據透明度(包括底層數據集、數據來源和數據處理方法),以及知識產權和版權材料的使用情況。問責制則是關鍵利益相關者應共同承擔的責任,包括研究人員、資助者、政策制定者和出版商,應建立問責標準和相關信息。3.2 質量和誠信確保質量和誠信是在學術研究中AIGC應用建立信任的基礎。從算法的設計和構建,到用于訓練AIGC的輸入,再到實際應用中使用的輸入,應堅持問責和透明原則,并
12、通過標識符或反饋等手段表明AIGC的使用,保證學術研究的質量和誠信不受AIGC技術使用的影響。3.3 隱私和安全隱私和安全是AIGC使用的基本法律原則。目標2原則3學術出版中AIGC使用邊界指南目標原則學術出版中AIGC使用邊界指南原則行為框架/實踐指導03于生成文本的提示和問題;文本中由AIGC編寫或共同編寫的部分;論文中因使用AIGC而產生的想法。若作者使用此類工具撰寫了稿件的任何部分,則必須在方法或致謝部分中公開、透明、詳細地進行描述?!灸0濉柯暶鳎涸诒咀髌返臏蕚溥^程中,作者使用了AIGC具體工具/服務名稱來使用目的:如文獻調研/數據分析/圖表制作等。使用此工具/服務后,作者根據需要對內
13、容進行了審查和編輯,并對出版物的內容承擔全部責任。4.2.4 同行評審在同行評審過程中,作者可使用AIGC幫助回復評審意見,但作者需對同行評審意見的回復負責,如果回復受到質疑,也應由作者證明其回復是合理的。在同行評審過程中,AIGC可以將評審意見進行匯總和分類標注,幫助作者快速理解評審意見,并為作者推薦合適的回復內容,從而高效地回應評審意見。4.3 論文發表/出版后4.3.1 數據倉儲和共享在符合相關要求的前提下,鼓勵作者公開原始數據,以審查防范數據污染、造假的問題。作者應該對論文中的數據進行嚴格檢查,確保數據的來源準確、完整且真實可靠。數據檢查的側重點包括數據的收集和處理方法、實驗、測量精度
14、和準確性,以及數據存儲方法等。對于有實驗過程的研究性論文,研究人員應及時、準確、詳細地記錄實驗和數據收集過程,避免記錄錯誤或遺漏等問題,并將實驗數據和過程記錄一并提交。4.3.2 AIGC相關材料提交、存檔鼓勵研究人員(在某些情況下)分享他們的研究數據,包括但不限于:原始數據、處理后的數據、軟件、算法、協議、方法、材料等。特別是由AIGC生成的文本、圖片、程序等內容應作為補充材料提交、存檔。4.3.3 AIGC產生內容的檢測和發現鼓勵期刊和編輯使用新的工具來檢測、識別由AIGC產生的內容。建立針對AIGC工具的審查程序,開發相應技術,進行人工審查和自動化檢測。檢測結果作為輔助判斷依據,根據論文
15、的使用范圍、期刊的要求、論文整體水平等綜合研判處理。研究人員使用AIGC直接生成的稿件文字等資料必須提供明確的披露和聲明,否則將構成學術不端行為。例如,從AIGC中提取新生成的文本作為稿件內容而未注明的,將被視為抄襲。由研究人員自己來完成,特別是論文重要部分的撰寫。使用AIGC的目的只是如何以最佳可讀的方式傳達作者生成的科學知識。4.1.5 語言和潤色學術語言服務:語言不應該成為學術交流與科學傳播的障礙。AIGC可以作為高標準語言檢查器,提高稿件可讀性和寫作質量,以消除研究傳播中的語言障礙。目前,AIGC的學術語言服務可以幫助非英語母語的研究人員潤色稿件使其符合國際期刊的投稿要求。但研究人員也
16、需注意,當手稿(全部或部分)輸入到公共AIGC中時,有可能成為大型語言模型訓練語料庫的一部分。4.1.6 引文整理當涉及AIGC推薦的任何內容時,“引用相關性”至關重要。研究人員需確保引用的內容與論文切實相關,包括引文和被引內容的真實性。引文格式檢查:AIGC可以檢查引用的文獻是否符合學術論文的引文格式,并指出可能存在的錯誤或缺陷。自動引用生成:AIGC可以幫助研究人員確定引用來源,并根據作者提供的文獻信息,自動生成符合學術論文引文格式要求的引用。但AIGC僅應作為一種輔助工具,作者仍需仔細核對引用文獻的格式和內容,以確保引用符合學術論文的規范要求。參考文獻自動排序:AIGC可以按照指定的引文
17、格式自動對參考文獻列表進行排序和順序校對,在學術寫作中幫助作者完成規范引用的相關任務,減少人工操作的繁瑣,提高論文的質量和研究人員的效率。4.2 投稿階段AIGC可以在投稿階段提供幫助,但這需要研究人員的專業判斷,并承擔最終的責任。4.2.1 作者署名在沒有人類研究人員指導的情況下,AIGC不能獨立發起一項原創性研究,也不能對已發表的作品或研究設計負責。同樣,它在絕大多數國家也沒有法律地位或持有或轉讓版權的能力,而這些責任和能力是對作者身份的基本要求。因此,根據COPE對人工智能工具的立場聲明,AIGC不能履行文章作者的角色,也不能被列為文章作者。4.2.2 規范引用所有來自其他來源的內容必須
18、經過仔細確認、恰當引用標注。研究人員對于AIGC所提供的資料需要驗證其真實性和準確性,并對其底層數據來源、工具、獲取方式、處理等進行引用標注。4.2.3 披露和聲明對AIGC使用情況進行充分、正確的披露和聲明。應明確以下內容:使用者;人工智能技術或系統(需注明版本號);使用的時間和日期;用獻結論,為研究人員提供參考;幫助研究人員發現新的信息來源,并跟蹤研究領域最新進展。需要注意的是,由于AIGC提供的參考文獻可能是虛構或過時的,使用AIGC支持其文獻綜述的研究人員必須閱讀并驗證AIGC提供的每項建議和參考文獻的真實性。概念解答:AIGC可以回答一些簡單的概念問題,為研究人員在構建章節內容時提供
19、幫助。但要注意,AIGC是基于已有研究提供的概念解答,研究人員在使用時要注意概念的適用性。觀點類資料調研:AIGC可以采集文本中公眾或專家對某些主題的觀點、情感及情感傾向的相關數據資料。研究人員必須監督和控制AIGC提供的觀點資料,必要時對AIGC提供的資料進行清洗處理,以確保研究人員使用的資料是有效、無偏的,防止傳播不正確、有偏見或歧視性的信息。4.1.2 統計分析某些情況下,研究人員已經收集了數據,但不確定用何種最佳的統計分析來驗證其假設。研究人員可使用AIGC來選擇最合適的分析方法或進行統計分析,但所用的數據必須是研究人員進行實驗并收集的,并且研究人員需要對AIGC所提供的統計分析結果進
20、行驗證,確保統計結果可靠性。數據分析和解釋:研究人員可以借助AIGC解釋數據,計算統計學指標,進行一些簡單的數據分析和統計結果的描述,但不能取代他們自己對數據的解釋。統計方法的建議和指導:AIGC可以根據問題和領域知識,為研究人員提供統計分析建議和指導,但只是基于其所學習的語言模型和知識庫,可能存在缺失和不準確。因此,研究人員需甄別AIGC所提供的統計分析建議的可行性,結合其他可靠統計分析和數據挖掘工具進行判斷,或向專業的領域專家尋求指導和幫助,最終判斷是否采納AIGC提供的建議。4.1.3 圖表制作輔助生成圖表:根據數據特點和作圖目的,AIGC可以依據不同的運用場景,推薦合適的統計圖表類型,
21、直觀呈現數據結論,有效地傳遞信息,從而節省研究人員制作圖表的時間,提高寫作效率。但蛋白質印跡實驗圖、細胞技術分析、組織細胞染色圖等實驗生成類圖像必須由真實開展的實驗研究獲得,不可通過AIGC直接生成。圖表格式處理和優化:根據數據量和圖表需求,研究人員可以使用AIGC輔助調整圖表樣式,對圖表進行格式化處理,例如調整字體大小、數據標注、添加圖例、更改顏色等,使圖表更清晰、美觀,更易于理解。4.1.4 文字撰寫在論文撰寫過程中,AIGC可用于提高文本可讀性、啟發內容邏輯性、提供句式等,以供研究人員參考撰寫,但不應該用來產生研究假設、直接撰寫整篇論文文本或解釋數據、得出科學結論等。所有屬于科學或智力貢
22、獻范圍的任務都應該AIGC可在研究開展及學術出版的各個階段提供輔助作用(服務)。為了營造良好的科研氛圍,防患于未然,避免/減少不當使用AIGC行為的發生,本部分提供一個符合道德行為的框架,以幫助作者、研究機構、學術期刊出版單位等就如何合規合理地使用AIGC做出指導。4.1 研究開展和論文撰寫階段本部分以指導性建議為主,對研究人員投稿前的研究開展和論文撰寫階段使用AIGC提出建議。4.1.1 資料收集AIGC所提供的資料是基于大數據和語言模型生成和抽取的,其準確性和真實性缺乏考量和驗證,需要研究人員確認內容的可靠性。文獻調研:可以借助AIGC收集關鍵詞或主題相關參考文獻,并進行分類和梳理,總結參
23、考文行為框架/實踐指導4在使用AIGC時應尊重隱私和數據保護,包括數據、隱私和安全影響評估,并通過適當的數據匿名來保護隱私、數據保護和安全措施來確保數據安全。3.4 公平使用AIGC時應秉持公平原則,避免偏見。由于人工智能具有復制和放大偏差的風險,因此在訓練數據選擇、算法設計、模型生成和優化、使用過程中,應仔細評估和審查潛在的偏差來源,并建立反饋機制,監測和審查可能的不公平現象,及時糾偏。同時,AIGC能夠幫助提供諸如語言潤色等服務,減少此類文化或語言上的不公平現象。3.5 可持續發展AI系統的多學科性質使其非常適合解決全球關注的領域,如聯合國可持續發展目標、碳中和等。它還為公共和私營組織提供
24、了提高效率的機會,以實現更大的生態可持續性和責任。AI系統承載著造福全人類,包括子孫后代的承諾。為高質量輸入數據的供應商提供資金和其他獎勵措施,如出版商創建的出版物和數據庫,有助于提取重要的可采取行動的知識??沙掷m發展應是AIGC本身的核心原則。為減少重復和浪費,使用AIGC應避免過度依賴可能暫時或永久不可用的數據,同時工具的功能模塊應基于公認標準和指南,以確保數據可查找、可訪問、可互操作和可重復使用。學術出版中AIGC使用邊界指南行為框架/實踐指導04于生成文本的提示和問題;文本中由AIGC編寫或共同編寫的部分;論文中因使用AIGC而產生的想法。若作者使用此類工具撰寫了稿件的任何部分,則必須
25、在方法或致謝部分中公開、透明、詳細地進行描述?!灸0濉柯暶鳎涸诒咀髌返臏蕚溥^程中,作者使用了AIGC具體工具/服務名稱來使用目的:如文獻調研/數據分析/圖表制作等。使用此工具/服務后,作者根據需要對內容進行了審查和編輯,并對出版物的內容承擔全部責任。4.2.4 同行評審在同行評審過程中,作者可使用AIGC幫助回復評審意見,但作者需對同行評審意見的回復負責,如果回復受到質疑,也應由作者證明其回復是合理的。在同行評審過程中,AIGC可以將評審意見進行匯總和分類標注,幫助作者快速理解評審意見,并為作者推薦合適的回復內容,從而高效地回應評審意見。4.3 論文發表/出版后4.3.1 數據倉儲和共享在符合
26、相關要求的前提下,鼓勵作者公開原始數據,以審查防范數據污染、造假的問題。作者應該對論文中的數據進行嚴格檢查,確保數據的來源準確、完整且真實可靠。數據檢查的側重點包括數據的收集和處理方法、實驗、測量精度和準確性,以及數據存儲方法等。對于有實驗過程的研究性論文,研究人員應及時、準確、詳細地記錄實驗和數據收集過程,避免記錄錯誤或遺漏等問題,并將實驗數據和過程記錄一并提交。4.3.2 AIGC相關材料提交、存檔鼓勵研究人員(在某些情況下)分享他們的研究數據,包括但不限于:原始數據、處理后的數據、軟件、算法、協議、方法、材料等。特別是由AIGC生成的文本、圖片、程序等內容應作為補充材料提交、存檔。4.3
27、.3 AIGC產生內容的檢測和發現鼓勵期刊和編輯使用新的工具來檢測、識別由AIGC產生的內容。建立針對AIGC工具的審查程序,開發相應技術,進行人工審查和自動化檢測。檢測結果作為輔助判斷依據,根據論文的使用范圍、期刊的要求、論文整體水平等綜合研判處理。研究人員使用AIGC直接生成的稿件文字等資料必須提供明確的披露和聲明,否則將構成學術不端行為。例如,從AIGC中提取新生成的文本作為稿件內容而未注明的,將被視為抄襲。由研究人員自己來完成,特別是論文重要部分的撰寫。使用AIGC的目的只是如何以最佳可讀的方式傳達作者生成的科學知識。4.1.5 語言和潤色學術語言服務:語言不應該成為學術交流與科學傳播
28、的障礙。AIGC可以作為高標準語言檢查器,提高稿件可讀性和寫作質量,以消除研究傳播中的語言障礙。目前,AIGC的學術語言服務可以幫助非英語母語的研究人員潤色稿件使其符合國際期刊的投稿要求。但研究人員也需注意,當手稿(全部或部分)輸入到公共AIGC中時,有可能成為大型語言模型訓練語料庫的一部分。4.1.6 引文整理當涉及AIGC推薦的任何內容時,“引用相關性”至關重要。研究人員需確保引用的內容與論文切實相關,包括引文和被引內容的真實性。引文格式檢查:AIGC可以檢查引用的文獻是否符合學術論文的引文格式,并指出可能存在的錯誤或缺陷。自動引用生成:AIGC可以幫助研究人員確定引用來源,并根據作者提供
29、的文獻信息,自動生成符合學術論文引文格式要求的引用。但AIGC僅應作為一種輔助工具,作者仍需仔細核對引用文獻的格式和內容,以確保引用符合學術論文的規范要求。參考文獻自動排序:AIGC可以按照指定的引文格式自動對參考文獻列表進行排序和順序校對,在學術寫作中幫助作者完成規范引用的相關任務,減少人工操作的繁瑣,提高論文的質量和研究人員的效率。4.2 投稿階段AIGC可以在投稿階段提供幫助,但這需要研究人員的專業判斷,并承擔最終的責任。4.2.1 作者署名在沒有人類研究人員指導的情況下,AIGC不能獨立發起一項原創性研究,也不能對已發表的作品或研究設計負責。同樣,它在絕大多數國家也沒有法律地位或持有或
30、轉讓版權的能力,而這些責任和能力是對作者身份的基本要求。因此,根據COPE對人工智能工具的立場聲明,AIGC不能履行文章作者的角色,也不能被列為文章作者。4.2.2 規范引用所有來自其他來源的內容必須經過仔細確認、恰當引用標注。研究人員對于AIGC所提供的資料需要驗證其真實性和準確性,并對其底層數據來源、工具、獲取方式、處理等進行引用標注。4.2.3 披露和聲明對AIGC使用情況進行充分、正確的披露和聲明。應明確以下內容:使用者;人工智能技術或系統(需注明版本號);使用的時間和日期;用獻結論,為研究人員提供參考;幫助研究人員發現新的信息來源,并跟蹤研究領域最新進展。需要注意的是,由于AIGC提
31、供的參考文獻可能是虛構或過時的,使用AIGC支持其文獻綜述的研究人員必須閱讀并驗證AIGC提供的每項建議和參考文獻的真實性。概念解答:AIGC可以回答一些簡單的概念問題,為研究人員在構建章節內容時提供幫助。但要注意,AIGC是基于已有研究提供的概念解答,研究人員在使用時要注意概念的適用性。觀點類資料調研:AIGC可以采集文本中公眾或專家對某些主題的觀點、情感及情感傾向的相關數據資料。研究人員必須監督和控制AIGC提供的觀點資料,必要時對AIGC提供的資料進行清洗處理,以確保研究人員使用的資料是有效、無偏的,防止傳播不正確、有偏見或歧視性的信息。4.1.2 統計分析某些情況下,研究人員已經收集了
32、數據,但不確定用何種最佳的統計分析來驗證其假設。研究人員可使用AIGC來選擇最合適的分析方法或進行統計分析,但所用的數據必須是研究人員進行實驗并收集的,并且研究人員需要對AIGC所提供的統計分析結果進行驗證,確保統計結果可靠性。數據分析和解釋:研究人員可以借助AIGC解釋數據,計算統計學指標,進行一些簡單的數據分析和統計結果的描述,但不能取代他們自己對數據的解釋。統計方法的建議和指導:AIGC可以根據問題和領域知識,為研究人員提供統計分析建議和指導,但只是基于其所學習的語言模型和知識庫,可能存在缺失和不準確。因此,研究人員需甄別AIGC所提供的統計分析建議的可行性,結合其他可靠統計分析和數據挖
33、掘工具進行判斷,或向專業的領域專家尋求指導和幫助,最終判斷是否采納AIGC提供的建議。4.1.3 圖表制作輔助生成圖表:根據數據特點和作圖目的,AIGC可以依據不同的運用場景,推薦合適的統計圖表類型,直觀呈現數據結論,有效地傳遞信息,從而節省研究人員制作圖表的時間,提高寫作效率。但蛋白質印跡實驗圖、細胞技術分析、組織細胞染色圖等實驗生成類圖像必須由真實開展的實驗研究獲得,不可通過AIGC直接生成。圖表格式處理和優化:根據數據量和圖表需求,研究人員可以使用AIGC輔助調整圖表樣式,對圖表進行格式化處理,例如調整字體大小、數據標注、添加圖例、更改顏色等,使圖表更清晰、美觀,更易于理解。4.1.4
34、文字撰寫在論文撰寫過程中,AIGC可用于提高文本可讀性、啟發內容邏輯性、提供句式等,以供研究人員參考撰寫,但不應該用來產生研究假設、直接撰寫整篇論文文本或解釋數據、得出科學結論等。所有屬于科學或智力貢獻范圍的任務都應該學術出版中AIGC使用邊界指南行為框架/實踐指導05于生成文本的提示和問題;文本中由AIGC編寫或共同編寫的部分;論文中因使用AIGC而產生的想法。若作者使用此類工具撰寫了稿件的任何部分,則必須在方法或致謝部分中公開、透明、詳細地進行描述?!灸0濉柯暶鳎涸诒咀髌返臏蕚溥^程中,作者使用了AIGC具體工具/服務名稱來使用目的:如文獻調研/數據分析/圖表制作等。使用此工具/服務后,作者
35、根據需要對內容進行了審查和編輯,并對出版物的內容承擔全部責任。4.2.4 同行評審在同行評審過程中,作者可使用AIGC幫助回復評審意見,但作者需對同行評審意見的回復負責,如果回復受到質疑,也應由作者證明其回復是合理的。在同行評審過程中,AIGC可以將評審意見進行匯總和分類標注,幫助作者快速理解評審意見,并為作者推薦合適的回復內容,從而高效地回應評審意見。4.3 論文發表/出版后4.3.1 數據倉儲和共享在符合相關要求的前提下,鼓勵作者公開原始數據,以審查防范數據污染、造假的問題。作者應該對論文中的數據進行嚴格檢查,確保數據的來源準確、完整且真實可靠。數據檢查的側重點包括數據的收集和處理方法、實
36、驗、測量精度和準確性,以及數據存儲方法等。對于有實驗過程的研究性論文,研究人員應及時、準確、詳細地記錄實驗和數據收集過程,避免記錄錯誤或遺漏等問題,并將實驗數據和過程記錄一并提交。4.3.2 AIGC相關材料提交、存檔鼓勵研究人員(在某些情況下)分享他們的研究數據,包括但不限于:原始數據、處理后的數據、軟件、算法、協議、方法、材料等。特別是由AIGC生成的文本、圖片、程序等內容應作為補充材料提交、存檔。4.3.3 AIGC產生內容的檢測和發現鼓勵期刊和編輯使用新的工具來檢測、識別由AIGC產生的內容。建立針對AIGC工具的審查程序,開發相應技術,進行人工審查和自動化檢測。檢測結果作為輔助判斷依
37、據,根據論文的使用范圍、期刊的要求、論文整體水平等綜合研判處理。研究人員使用AIGC直接生成的稿件文字等資料必須提供明確的披露和聲明,否則將構成學術不端行為。例如,從AIGC中提取新生成的文本作為稿件內容而未注明的,將被視為抄襲。由研究人員自己來完成,特別是論文重要部分的撰寫。使用AIGC的目的只是如何以最佳可讀的方式傳達作者生成的科學知識。4.1.5 語言和潤色學術語言服務:語言不應該成為學術交流與科學傳播的障礙。AIGC可以作為高標準語言檢查器,提高稿件可讀性和寫作質量,以消除研究傳播中的語言障礙。目前,AIGC的學術語言服務可以幫助非英語母語的研究人員潤色稿件使其符合國際期刊的投稿要求。
38、但研究人員也需注意,當手稿(全部或部分)輸入到公共AIGC中時,有可能成為大型語言模型訓練語料庫的一部分。4.1.6 引文整理當涉及AIGC推薦的任何內容時,“引用相關性”至關重要。研究人員需確保引用的內容與論文切實相關,包括引文和被引內容的真實性。引文格式檢查:AIGC可以檢查引用的文獻是否符合學術論文的引文格式,并指出可能存在的錯誤或缺陷。自動引用生成:AIGC可以幫助研究人員確定引用來源,并根據作者提供的文獻信息,自動生成符合學術論文引文格式要求的引用。但AIGC僅應作為一種輔助工具,作者仍需仔細核對引用文獻的格式和內容,以確保引用符合學術論文的規范要求。參考文獻自動排序:AIGC可以按
39、照指定的引文格式自動對參考文獻列表進行排序和順序校對,在學術寫作中幫助作者完成規范引用的相關任務,減少人工操作的繁瑣,提高論文的質量和研究人員的效率。4.2 投稿階段AIGC可以在投稿階段提供幫助,但這需要研究人員的專業判斷,并承擔最終的責任。4.2.1 作者署名在沒有人類研究人員指導的情況下,AIGC不能獨立發起一項原創性研究,也不能對已發表的作品或研究設計負責。同樣,它在絕大多數國家也沒有法律地位或持有或轉讓版權的能力,而這些責任和能力是對作者身份的基本要求。因此,根據COPE對人工智能工具的立場聲明,AIGC不能履行文章作者的角色,也不能被列為文章作者。4.2.2 規范引用所有來自其他來
40、源的內容必須經過仔細確認、恰當引用標注。研究人員對于AIGC所提供的資料需要驗證其真實性和準確性,并對其底層數據來源、工具、獲取方式、處理等進行引用標注。4.2.3 披露和聲明對AIGC使用情況進行充分、正確的披露和聲明。應明確以下內容:使用者;人工智能技術或系統(需注明版本號);使用的時間和日期;用學術出版中AIGC使用邊界指南行為框架/實踐指導06于生成文本的提示和問題;文本中由AIGC編寫或共同編寫的部分;論文中因使用AIGC而產生的想法。若作者使用此類工具撰寫了稿件的任何部分,則必須在方法或致謝部分中公開、透明、詳細地進行描述?!灸0濉柯暶鳎涸诒咀髌返臏蕚溥^程中,作者使用了AIGC具體
41、工具/服務名稱來使用目的:如文獻調研/數據分析/圖表制作等。使用此工具/服務后,作者根據需要對內容進行了審查和編輯,并對出版物的內容承擔全部責任。4.2.4 同行評審在同行評審過程中,作者可使用AIGC幫助回復評審意見,但作者需對同行評審意見的回復負責,如果回復受到質疑,也應由作者證明其回復是合理的。在同行評審過程中,AIGC可以將評審意見進行匯總和分類標注,幫助作者快速理解評審意見,并為作者推薦合適的回復內容,從而高效地回應評審意見。4.3 論文發表/出版后4.3.1 數據倉儲和共享在符合相關要求的前提下,鼓勵作者公開原始數據,以審查防范數據污染、造假的問題。作者應該對論文中的數據進行嚴格檢
42、查,確保數據的來源準確、完整且真實可靠。數據檢查的側重點包括數據的收集和處理方法、實驗、測量精度和準確性,以及數據存儲方法等。對于有實驗過程的研究性論文,研究人員應及時、準確、詳細地記錄實驗和數據收集過程,避免記錄錯誤或遺漏等問題,并將實驗數據和過程記錄一并提交。4.3.2 AIGC相關材料提交、存檔鼓勵研究人員(在某些情況下)分享他們的研究數據,包括但不限于:原始數據、處理后的數據、軟件、算法、協議、方法、材料等。特別是由AIGC生成的文本、圖片、程序等內容應作為補充材料提交、存檔。4.3.3 AIGC產生內容的檢測和發現鼓勵期刊和編輯使用新的工具來檢測、識別由AIGC產生的內容。建立針對A
43、IGC工具的審查程序,開發相應技術,進行人工審查和自動化檢測。檢測結果作為輔助判斷依據,根據論文的使用范圍、期刊的要求、論文整體水平等綜合研判處理。研究人員使用AIGC直接生成的稿件文字等資料必須提供明確的披露和聲明,否則將構成學術不端行為。例如,從AIGC中提取新生成的文本作為稿件內容而未注明的,將被視為抄襲。由研究人員自己來完成,特別是論文重要部分的撰寫。使用AIGC的目的只是如何以最佳可讀的方式傳達作者生成的科學知識。4.1.5 語言和潤色學術語言服務:語言不應該成為學術交流與科學傳播的障礙。AIGC可以作為高標準語言檢查器,提高稿件可讀性和寫作質量,以消除研究傳播中的語言障礙。目前,A
44、IGC的學術語言服務可以幫助非英語母語的研究人員潤色稿件使其符合國際期刊的投稿要求。但研究人員也需注意,當手稿(全部或部分)輸入到公共AIGC中時,有可能成為大型語言模型訓練語料庫的一部分。4.1.6 引文整理當涉及AIGC推薦的任何內容時,“引用相關性”至關重要。研究人員需確保引用的內容與論文切實相關,包括引文和被引內容的真實性。引文格式檢查:AIGC可以檢查引用的文獻是否符合學術論文的引文格式,并指出可能存在的錯誤或缺陷。自動引用生成:AIGC可以幫助研究人員確定引用來源,并根據作者提供的文獻信息,自動生成符合學術論文引文格式要求的引用。但AIGC僅應作為一種輔助工具,作者仍需仔細核對引用
45、文獻的格式和內容,以確保引用符合學術論文的規范要求。參考文獻自動排序:AIGC可以按照指定的引文格式自動對參考文獻列表進行排序和順序校對,在學術寫作中幫助作者完成規范引用的相關任務,減少人工操作的繁瑣,提高論文的質量和研究人員的效率。4.2 投稿階段AIGC可以在投稿階段提供幫助,但這需要研究人員的專業判斷,并承擔最終的責任。4.2.1 作者署名在沒有人類研究人員指導的情況下,AIGC不能獨立發起一項原創性研究,也不能對已發表的作品或研究設計負責。同樣,它在絕大多數國家也沒有法律地位或持有或轉讓版權的能力,而這些責任和能力是對作者身份的基本要求。因此,根據COPE對人工智能工具的立場聲明,AI
46、GC不能履行文章作者的角色,也不能被列為文章作者。4.2.2 規范引用所有來自其他來源的內容必須經過仔細確認、恰當引用標注。研究人員對于AIGC所提供的資料需要驗證其真實性和準確性,并對其底層數據來源、工具、獲取方式、處理等進行引用標注。4.2.3 披露和聲明對AIGC使用情況進行充分、正確的披露和聲明。應明確以下內容:使用者;人工智能技術或系統(需注明版本號);使用的時間和日期;用獻結論,為研究人員提供參考;幫助研究人員發現新的信息來源,并跟蹤研究領域最新進展。需要注意的是,由于AIGC提供的參考文獻可能是虛構或過時的,使用AIGC支持其文獻綜述的研究人員必須閱讀并驗證AIGC提供的每項建議
47、和參考文獻的真實性。概念解答:AIGC可以回答一些簡單的概念問題,為研究人員在構建章節內容時提供幫助。但要注意,AIGC是基于已有研究提供的概念解答,研究人員在使用時要注意概念的適用性。觀點類資料調研:AIGC可以采集文本中公眾或專家對某些主題的觀點、情感及情感傾向的相關數據資料。研究人員必須監督和控制AIGC提供的觀點資料,必要時對AIGC提供的資料進行清洗處理,以確保研究人員使用的資料是有效、無偏的,防止傳播不正確、有偏見或歧視性的信息。4.1.2 統計分析某些情況下,研究人員已經收集了數據,但不確定用何種最佳的統計分析來驗證其假設。研究人員可使用AIGC來選擇最合適的分析方法或進行統計分
48、析,但所用的數據必須是研究人員進行實驗并收集的,并且研究人員需要對AIGC所提供的統計分析結果進行驗證,確保統計結果可靠性。數據分析和解釋:研究人員可以借助AIGC解釋數據,計算統計學指標,進行一些簡單的數據分析和統計結果的描述,但不能取代他們自己對數據的解釋。統計方法的建議和指導:AIGC可以根據問題和領域知識,為研究人員提供統計分析建議和指導,但只是基于其所學習的語言模型和知識庫,可能存在缺失和不準確。因此,研究人員需甄別AIGC所提供的統計分析建議的可行性,結合其他可靠統計分析和數據挖掘工具進行判斷,或向專業的領域專家尋求指導和幫助,最終判斷是否采納AIGC提供的建議。4.1.3 圖表制
49、作輔助生成圖表:根據數據特點和作圖目的,AIGC可以依據不同的運用場景,推薦合適的統計圖表類型,直觀呈現數據結論,有效地傳遞信息,從而節省研究人員制作圖表的時間,提高寫作效率。但蛋白質印跡實驗圖、細胞技術分析、組織細胞染色圖等實驗生成類圖像必須由真實開展的實驗研究獲得,不可通過AIGC直接生成。圖表格式處理和優化:根據數據量和圖表需求,研究人員可以使用AIGC輔助調整圖表樣式,對圖表進行格式化處理,例如調整字體大小、數據標注、添加圖例、更改顏色等,使圖表更清晰、美觀,更易于理解。4.1.4 文字撰寫在論文撰寫過程中,AIGC可用于提高文本可讀性、啟發內容邏輯性、提供句式等,以供研究人員參考撰寫
50、,但不應該用來產生研究假設、直接撰寫整篇論文文本或解釋數據、得出科學結論等。所有屬于科學或智力貢獻范圍的任務都應該AIGC可在研究開展及學術出版的各個階段提供輔助作用(服務)。為了營造良好的科研氛圍,防患于未然,避免/減少不當使用AIGC行為的發生,本部分提供一個符合道德行為的框架,以幫助作者、研究機構、學術期刊出版單位等就如何合規合理地使用AIGC做出指導。4.1 研究開展和論文撰寫階段本部分以指導性建議為主,對研究人員投稿前的研究開展和論文撰寫階段使用AIGC提出建議。4.1.1 資料收集AIGC所提供的資料是基于大數據和語言模型生成和抽取的,其準確性和真實性缺乏考量和驗證,需要研究人員確
51、認內容的可靠性。文獻調研:可以借助AIGC收集關鍵詞或主題相關參考文獻,并進行分類和梳理,總結參考文AIGC屬新興事物,涉及多元主體,其在學術出版中的使用場景具有多樣性,AIGC使用的邊界也存在大量模糊地帶尚待厘清。中國科學技術信息研究所聯合愛思唯爾、施普林格自然、約翰威立等國際出版集團,在征求有關各方建議的基礎上,從原則與行為框架/實踐指導等方面對AIGC技術使用提出建議,以達到防范學術不端、加強誠信治理和引導相關利益主體就AIGC使用達成共識的目的。值得注意的是,制定本指南的目的是為AIGC技術使用提供一個啟發式的框架,還有一些更為具體、實踐性的問題有待進一步研究。比如,AIGC技術在學術
52、出版應用中涉及的主體眾多,既包括AIGC技術開發、應用的所有者和使用者,也涉及學術出版鏈條中如作者、期刊、編輯、審稿人、傳播者、受眾及科研管理者等各責任主體,如何厘清各方關系,明確主體責任和制約關系,清晰劃定責任對于促進各方明確自身職責有著重要意義。同時,由于對不當使用AIGC技術的處理尚未達成共識,對涉及的各種不當使用情況提出適當的處理建議對推動責任落實也有著至關重要的作用。AIGC技術與工具仍在不斷革新和發展中,本指南的適用范圍、行為框架也需要定期調整以應對這一持續變化帶來的新挑戰與新問題。積極呼吁各方對本指南提出建議和反饋,幫助我們不斷完善AIGC技術使用指南,給相關主體提供更為具體、詳
53、實的實踐框架,以防止學術不端的發生??偨Y507學術出版中AIGC使用邊界指南總結本指南在中國科學技術部科技監督與誠信建設司支持和指導下,由中國科學技術信息研究所牽頭,聯合愛思唯爾、施普林格自然、約翰威立國際出版集團(排名不分先后)的團隊協作完成。主要貢獻人為:中國科學技術信息研究所的鄭雯雯博士、楊代慶研究員、高繼平研究員、王美玲博士;愛思唯爾的Peter Lee先生、康曉伶女士、李季萌女士、研究誠信和出版倫理專家中心的研究團隊;施普林格自然的Nick Campbell博士、Chris Graf先生、Arjan Grootenboer先生、Alice Henchley女士、胡澤英女士、Steve
54、n Inchcoombe先生、Imogen Rose博士、Henning Schoenenberger先生、Katrin Stienemeier女士、Niels Peter Thomas博士、張立先生;約翰威立國際出版集團的Michael Streeter先生、Joyce Griffin女士、王宇女士。同時還有多位來自國內外科技出版領域和科技管理領域的專家學者和資深人士對本指南的內容給予了寶貴建議和指導,在此表示由衷感謝。致謝6學術出版中AIGC使用邊界指南致謝08中國科學技術信息研究所科學計量與評價研究中心北京市海淀區復興路15號郵編:100038電話:+86-10 58882604聯系人:鄭雯雯郵箱: