欧美国产在线看_www.日本三级_亚洲女人久久久_国产高潮在线观看_天天干天天操天天操_老头吃奶性行交视频_欧美日韩生活片_国产人妖在线播放_一级黄色大片儿_毛片aaaaaa

僅32B,昆侖萬維開源「Skywork-SWE-32B」,拿下代碼開源SOTA

2025-06-20 14:54:41
野馬商業實驗室
關注
2025-06-20

僅32B,昆侖萬維開源「Skywork-SWE-32B」,拿下代碼開源SOTA

6月20日,昆侖萬維發布軟件工程(Software Engineering, SWE)自主代碼智能體基座模型Skywork-SWE,在開源32B模型規模下實現了業界最強的倉庫級代碼修復能力。昆侖萬維團隊通過構建超過1萬個可驗證的GitHub倉庫任務實例,打造出目前最大規模的可驗證GitHub倉庫級代碼修復的數據集,并系統性驗證了大模型在軟件工程任務上的數據縮放定律(Scaling Law)。

Skywork-SWE-32B模型在SWE-bench Verified基準上取得38.0% pass@1準確率,刷新Qwen2.5-Coder-32B系列模型在OpenHands代碼框架下的最佳成績。進一步引入測試時擴展技術后,模型表現提升至47.0%的準確率,不僅超越了現有參數規模在32B以下的開源模型,也顯著效縮小了與閉源模型之間的性能差距。

Skywork-SWE-32B直通車:

  • 技術報告:https://huggingface.co/Skywork/Skywork-SWE-32B/resolve/main/assets/Report.pdf

  • 博客地址:https://quixotic-sting-239.notion.site/eb17f379610040ceb54da5d5d24065bd

  • HuggingFace地址:https://huggingface.co/Skywork/Skywork-SWE-32B

2025年被廣泛認為是智能體(Agent)模型的元年,其核心特征包括“超多輪交互”和“超長上下文處理”。在眾多應用方向中,軟件工程SWE任務正成為大語言模型智能體的關鍵應用場景之一。

相比傳統的代碼生成任務(如代碼編程題解答),SWE任務更加貼近真實的軟件開發流程,涵蓋了從定位BUG、修改源代碼,到驗證修復效果的完整閉環。這類任務通常源自GitHub倉庫中的實際代碼工程問題,具備高度的真實性、復雜性和挑戰性,是評估智能體模型能力的一個重要基準。

SWE任務的獨特之處在于,它對模型提出了更高要求:不僅需要支持多輪交互和長上下文推理,還需具備處理跨文件依賴、調用工具鏈,以及在復雜環境中持續修復代碼問題的能力。這些能力全面考驗了智能體模型的工程實踐水平與系統性思維能力。

01三階段自動化流程,構建大規模、高質量SWE任務訓練數據集

盡管當前市面上已有不少工作聚焦于SWE任務并收集了相關的數據集,但當前的主流(訓練)數據集仍存在三大核心問題:

  • 缺乏可執行環境與驗證機制:已有開源數據(如SWE-bench-extra、SWE-Fixer)通常缺乏環境或單元測試來驗證數據正確性,導致生成的修復難以驗證。

  • 高質量訓練數據稀缺:盡管某些數據集規模較大(如 SWE-Dev、SWE-Gym),但缺乏經過嚴格驗證的訓練樣本,公開可用的高質量數據極為有限,導致開源模型在 SWE 任務上長期落后于閉源模型。

  • 數據規模法則適用性不明確:相較于自然語言領域中的任務,SWE任務現有的公開訓練數據體量較小,尚無法有效驗證數據擴展是否能帶來模型能力的持續增長。

為打破上述瓶頸,并且打造出具備工程實用性的SWE代碼智能體模型,昆侖萬維團隊首先在訓練階段自行構建了一套自動化、結構化、可復現的SWE數據收集與驗證流程,共分為三個階段、九個步驟(如下圖所示)。最終團隊構建出超1萬條高質量任務實例、8千條多輪交互的軌跡,為模型訓練提供堅實基礎。

圖丨Skywork-SWE完整數據收集與驗證流程

Skywork-SWE作為萬級高質量可驗證數據集,驅動智能體模型能力躍遷

在上述三個階段過程中,團隊實施了嚴格的數據篩選與構建流程。如下圖所示,團隊從最初超過15萬條候選代碼倉庫元數據中,最終篩選出約1萬條高質量實例,構建出當前規模最大、質量最高的可驗證SWE任務(訓練)數據集——Skywork-SWE。

圖丨數據構建過程中各個階段數據樣本量變化示意

Skywork-SWE數據集在任務數量與代碼覆蓋廣度方面,遠超現有同類數據集(如SWE-Gym Lite與SWE-bench Verified),為大模型提供了豐富、多樣且貼近實際的軟件工程任務樣本,持續推動智能體模型的能力進化。此外,Skywork-SWE數據集不僅涵蓋如Pydantic、SQLGlot、DVC等主流開源項目,還包含大量中小型倉庫,呈現出高度貼近真實開發生態的任務分布特征。這種貼近真實開發生態的數據構成,有助于提升模型在復雜多樣場景下的問題解決能力。

圖丨Skywork-SWE數據集的GitHub倉庫詞云

02 Skywork-SWE登頂32B開源SOTA

“Less artifact, more intelligence”(更少的人工約束,更多智能發揮) 是團隊開發軟件工程自主代碼智能體模型的核心理念。我們主張賦予AI更大自主權,由其決定工具使用與任務執行方式,而非人為預先設定規則流程。基于這一理念,最終選用目前最具自主性的開源OpenHands框架。

基于Skywork-SWE數據集的高質量智能體軌跡,昆侖萬維團隊微調得到Skywork-SWE-32B模型,該模型在SWE-bench Verified測評中取得優異成績。截至目前,Skywork-SWE-32B在SWE-Bench榜單中成為當前性能最強的32B開源代碼智能體大模型,刷新SWE-bench Verified基準上同等規模模型的最佳成績,充分展示了其工程實用價值:

1.Skywork-SWE-32B測評結果超越相同參數規模的模型。Skywork-SWE-32B基于開源OpenHands代碼Agent框架,實現了38.0% pass@1的準確率,達到了Qwen2.5-Coder-32B系列模型在OpenHands代碼框架下的最優水平。更為關鍵的是,實驗結果進一步表明:隨著訓練數據規模的持續擴展,模型性能持續提升,充分驗證了“數據規模擴展帶來的性能增益”在軟件工程任務中的有效性與適用性。

2.應用測試時擴展技術之后,Skywork-SWE-32B取得了最優性能。在引入測試時擴展技術(Test-Time Scaling,TTS)后,Skywork-SWE-32B (+ TTS) 的pass@1準確率進一步提升至47.0%,刷新了32B參數規模以下開源模型的SOTA。更值得關注的是,Skywork-SWE-32B在與參數量高達671B的DeepSeek-V3-0324模型對比中仍展現出明顯優勢,領先8.2個百分點。

3.Skywork-SWE-32B (+ TTS) 的表現接近甚至超越多數主流閉源大模型。Skywork-SWE-32B (+ TTS) 的pass@1準確率顯著超越了GPT-4.1-mini(23.86%)、 Claude 3.5 HaiKu(40.6%)和 OpenAI-o1-preview (41.3%),并且領先于Claude v3.5(46.0%)。

03持續探索更多Agent任務場景

過去半年多時間,昆侖萬維在獎勵模型、多模態、推理、視頻生成等方向開源了一系列SOTA級別模型,如今又在Agent(SWE任務)方向再下一城。繼5月天工超級智能體(Skywork Super Agents)面向全球發布后,今天我們又發布并開源了自主代碼智能體模型Skywork-SWE-32B模型,這不僅是公司堅定開源策略的重要實踐,更代表了我們對Agent在辦公任務、SWE任務場景中的重要探索。

通過Skywork-SWE數據集的構建,以及自主代碼智能體模型Skywork-SWE-32B模型的發布,團隊研究表明高質量且可執行驗證的數據是提升代碼智能體模型性能的關鍵瓶頸,系統化的數據擴展策略將在推動開源模型性能突破中發揮關鍵作用。基于此,我們期望Skywork-SWE-32B的開源,能夠助力社區在大語言模型驅動的軟件工程研究中持續演進。

未來,Skywork-SWE-32B模型將進一步拓展多編程語言支持以覆蓋更廣泛的開發場景,并探索融合運行時測試反饋的強化學習機制,為構建真正具備智能軟件開發能力的大語言模型奠定堅實基礎。同時,昆侖萬維也將積極探索更多Agent任務場景。

來源/


點贊
收藏
參與評論
全部評論

0條評論

    暫時沒有人評論

野馬商業實驗室
923文章
·
0評論
·
2粉絲
個人主頁
丰满大乳国产精品| 国产一级一片免费播放| 凹凸国产熟女精品视频| av在线播放亚洲| 久久久性生活视频| 男人操女人逼免费视频| 无码人妻丰满熟妇区五十路百度| www..com日韩| 国产成人无码一二三区视频| 国产午夜伦鲁鲁| 成人在线观看a| 天天干天天爽天天射| 亚洲精品综合在线观看| 三级黄色片播放| 精品成人免费视频| 男人天堂视频网| 91久久精品无码一区二区| av中文在线观看| 日韩不卡av在线| 你懂的国产视频| 久久偷拍免费视频| 五十路六十路七十路熟婆 | 成年免费在线观看| 久久久久久久久久久久| 日本免费观看网站| 香蕉视频网站入口| 国产一二三四在线| 久久最新免费视频| 在线观看免费视频a| 久久久一本二本三本| 欧亚乱熟女一区二区在线| 精品一级少妇久久久久久久| 91成人福利视频| 免费a级片在线观看| 精品无码人妻一区二区三区品| 日本中文字幕久久| 精品国产九九九| 熟妇人妻久久中文字幕| 顶级黑人搡bbw搡bbbb搡| 中文精品无码中文字幕无码专区| 99在线无码精品入口| 日本免费一区视频| 91视频在线网站| 国产911在线观看| 亚洲中文字幕久久精品无码喷水| 久久久久久久久精| 亚洲熟女乱色一区二区三区久久久| 黄色一级a毛片| 国产色视频一区二区三区qq号| www.av成人| 日韩有码免费视频| 九九热在线视频播放| 性一交一乱一透一a级| 日本少妇色视频| 日本a在线天堂| 天天影视色综合| 中文字幕精品一区二| 老女人性生活视频| 538精品在线视频| 天天干在线影院| 黄色av一区二区| 香蕉在线观看视频| 黄色一级片网址| 国产sm主人调教女m视频| 9久久婷婷国产综合精品性色| 国产视频123区| 久久黄色一级视频| 国产一区二区三区视频免费观看 | 欧妇女乱妇女乱视频| 国产精品揄拍100视频| 在线免费一区二区| 免费观看的毛片| 日本女人性生活视频| 午夜精品久久久久久久99热黄桃| 最新天堂在线视频| 免费在线观看亚洲视频| 日韩最新中文字幕| 欧美xxxx精品| 一本色道综合久久欧美日韩精品| 亚洲欧美激情另类| 伊人成人在线观看| 久久青青草原亚洲av无码麻豆| 污污的视频免费| 欧美黄色免费影院| 亚洲爆乳无码精品aaa片蜜桃| 中文字幕人妻一区二区| 精品国产乱码久久久久夜深人妻| 成人小视频在线观看免费| 亚洲国产综合久久| 亚洲成a人片在线www| 久久av综合网| 无码人妻aⅴ一区二区三区有奶水 无码免费一区二区三区 | 国产精品久久久久久久99| 国产三级在线观看视频| 国产免费久久久久| 久久久91视频| 欧美xxxx日本和非洲| 日本男女交配视频| 在线免费观看av网址| 欧美图片一区二区| 一本色道久久亚洲综合精品蜜桃| 精品国产av 无码一区二区三区 | 男人的天堂视频在线| 中国一级免费毛片| 自拍视频一区二区| 一道本视频在线观看| www.国产精品视频| 日韩中文在线字幕| 成人h动漫精品一区二区下载| 成年人网站免费在线观看 | 国产一级做a爱免费视频| 日韩大尺度视频| 爱福利视频一区二区| 国产a级片网站| 乱h高h女3p含苞待放| 波多野结衣在线网址| 免费看特级毛片| 欧洲猛交xxxx乱大交3| 日本天堂中文字幕| 中文字幕人妻一区二区三区在线视频| 免费无码国产v片在线观看| 精品国产亚洲av麻豆| 国产情侣第一页| 精品国产av鲁一鲁一区| 91成人综合网| 99久久精品国产成人一区二区 | 亚洲色成人网站www永久四虎 | 手机在线成人免费视频| 精品国产午夜福利在线观看| 91免费视频网站在线观看| 亚洲国产精彩视频| 黄在线观看网站| 黄色片一区二区三区| 哪个网站能看毛片| 秋霞欧美在线观看| 成年人免费大片| 老司机av网站| 亚洲精品mv在线观看| 欧美丰满少妇人妻精品| 久久久综合久久久| 日韩精品电影一区二区三区| 性无码专区无码| 日本精品人妻无码77777| 精品不卡一区二区| 欧美 国产 精品| 性生活黄色大片| www.99av.com| 日本一区二区三区网站| 少妇一级淫片免费放中国| 日韩国产第一页| 国产又粗又猛又爽又黄91| av免费观看大全| 国产精品久久AV无码| 农村黄色一级片| 美女黄色片视频| 欧美精品二区三区| 人妻丰满熟妇av无码区hd| 亚洲天堂资源在线| 一区二区视频免费看| 成人黄色片视频| 国产a∨精品一区二区三区仙踪林| 在线观看国产黄| 精品无码人妻少妇久久久久久| gv天堂gv无码男同在线观看| 久久久久久免费看| 国产性一乱一性一伧一色| 国产精品久久久久久久免费| 亚洲精品乱码久久| 永久免费网站视频在线观看| 欧美三级理论片| 中文字幕av网站| 青青草视频成人| 日本欧美视频在线观看| 久久久福利影院| 极品久久久久久| 欧美性猛交 xxxx| 欧美成人综合色| 老女人性淫交视频| 欧美性受xxxx狂喷水| 久久久久亚洲AV| 天堂av免费看| 少妇精品无码一区二区| 国产情侣在线视频| 米仓穗香在线观看| 动漫美女无遮挡免费| 免费看日批视频| 日韩中文字幕免费在线| 青青草华人在线视频| 亚洲精选一区二区三区| 国产精品theporn动漫| 日韩精品久久一区二区| 亚洲av成人片无码| 在线视频欧美亚洲| 911福利视频| 玖玖精品在线视频| 久久久久亚洲无码| 中文字幕观看在线| 高清av免费看| 青青草视频国产| 精品国产人妻一区二区三区| 国产又粗又猛又色又| 亚洲一级片免费观看| 国产在线播放观看| 免费黄色在线网址| 日本55丰满熟妇厨房伦| 自拍偷拍福利视频| 午夜免费一级片| 无罩大乳的熟妇正在播放| 人妻互换一区二区激情偷拍| 亚洲欧洲精品视频| 在线观看国产精品视频| 青青草国产在线观看| 69堂免费视频| 久草网站在线观看| 欧美这里只有精品| 99在线观看视频免费| 欧美性猛交xxx乱久交| 日本激情综合网| 国产精品成人国产乱| 一级黄色片视频| 国产老熟女伦老熟妇露脸| 色欲狠狠躁天天躁无码中文字幕 | 国产3p露脸普通话对白| 日韩一级视频在线观看| 亚洲精品一区二区三区蜜桃| 亚洲日本视频在线观看| 激情五月婷婷基地| 国产免费毛卡片| 青青草原在线免费观看| 丰满少妇一区二区| 91精产国品一二三| 成人黄色免费视频| 最好看的日本字幕mv视频大全| 久久精品亚洲天堂| 精品久久久久久久无码 | 国产污在线观看| 亚洲乱码在线观看| 一二区在线观看| 秋霞av一区二区三区| 久草资源在线视频| 午夜久久久精品| 人妻精品无码一区二区三区 | 超碰97人人射妻| 日韩精品一区二区在线视频| 国产一区二区视频在线观看免费| www在线观看免费视频| 中文字幕第九页| 天天干天天爽天天操| 91久久精品国产91性色69| 日韩精品在线一区二区三区| 日本三级中文字幕| 午夜偷拍福利视频| 久久激情免费视频| 在线观看免费视频污| 奇米影视四色在线| 欧美一级黄色影院| www.色就是色| 玩弄japan白嫩少妇hd| 美女福利视频在线| 国产熟女高潮视频| 999精品网站| 黄色av免费在线播放| 黄色av免费在线播放| 国产激情在线观看视频| 十八禁视频网站在线观看| 看av免费毛片手机播放| 久久久一本二本三本| 欧美女人性生活视频| 成人一级片网站| 国产激情在线观看视频| 麻豆av免费在线| 999精品视频在线| 三上悠亚在线一区| 麻豆成人在线视频| 国产精品1234区| 久久久免费高清视频| 免费av中文字幕| 国产口爆吞精一区二区| 成人av免费播放| 五月激情丁香婷婷| 伊人影院在线观看视频| 中文字幕免费在线播放| 亚洲第一成人网站| 永久免费看mv网站入口| 喜爱夜蒲2在线| 欧美黑人经典片免费观看| 高清在线观看免费| 三上悠亚av一区二区三区| 欧美三根一起进三p| 中日韩精品视频在线观看| 国产真人无遮挡作爱免费视频| 国产又粗又猛又黄| 日本精品久久久久久| 伦理片一区二区| 国产一二三四视频| 久久久久久久久久久久久国产| 中文字幕无码精品亚洲资源网久久| a√天堂在线观看| 亚洲免费成人在线视频| 精品国产免费观看| 国产又爽又黄免费软件| 午夜在线视频观看| 免费污网站在线观看| 一本二本三本亚洲码| 国产裸体舞一区二区三区| 日本中文字幕观看| 一级一片免费看| 刘亦菲毛片一区二区三区| 国产精品第七页| 波多野结衣爱爱视频| 久久美女福利视频| 九九视频在线观看| 亚洲在线免费观看视频| 日本女人黄色片| 在线观看免费黄色网址| 蜜臀av性久久久久蜜臀av| 在线免费视频a| 国产一级18片视频| 人妻少妇精品无码专区| 人妻熟女aⅴ一区二区三区汇编| 亚洲 欧洲 日韩| 天天爽夜夜爽一区二区三区| 成人毛片在线播放| 欧美一级免费片| 成人午夜免费影院| 日韩avxxx| 四虎成人永久免费视频| 粉嫩av一区二区夜夜嗨| 五月天精品视频| 日韩欧美一区二| 国内免费精品视频| 欧洲成人一区二区三区| 婷婷丁香综合网| 日本成人在线免费视频| 久久久久亚洲av成人毛片韩| 天天操天天干天天操| 久久久久久久久久97| 性欧美videossex精品| 中文天堂在线视频| 手机在线看片日韩| 少妇人妻无码专区视频| 可以免费在线观看的av| 性色av浪潮av| 波多野结衣亚洲色图| 久久久精品高清| 精品国产无码一区二区三区| 欧美另类69xxxx| 婷婷丁香激情网| 国产普通话bbwbbwbbw| 免费黄在线观看| 免费黄色一级网站| 国产绳艺sm调教室论坛| 亚洲天堂最新地址| 色噜噜狠狠一区二区| 99在线精品视频免费观看软件| 国产真人做爰视频免费| 91n.com在线观看| 国产女同91疯狂高潮互磨| а天堂中文在线资源| 老司机午夜性大片| 丰满人妻一区二区三区免费视频 | 亚洲国产欧美日韩在线| 日本精品福利视频| 韩国av中文字幕| 国产精品无码网站| 国产成人无码av在线播放dvd| 中文字幕人妻精品一区| 日本美女xxx| 日本成人xxx| 无码人妻久久一区二区三区蜜桃| 精品一区二区三区无码视频| 中文字幕在线欧美| 久久婷婷五月综合| 亚洲日本黄色片| 韩国三级与黑人| 91免费视频网站在线观看| 糖心vlog精品一区二区| 91无套直看片红桃在线观看| 婷婷激情综合五月天| 日本少妇一级片| 日韩a在线播放| 精品久久久无码中文字幕| 国产又黄又爽免费视频| 久久99国产综合精品免费| 国产精品免费无码| 欧美成人国产精品高潮| 国产日韩视频一区| 国产精品久久久毛片| 国产亚洲色婷婷久久| 成人免费观看视频在线观看| 性网爆门事件集合av| 蜜臀av色欲a片无码精品一区| 97超碰人人模人人人爽人人爱| 99视频只有精品| 最好看的日本字幕mv视频大全 | 久久久久精彩视频| 国产稀缺精品盗摄盗拍| 日本熟女一区二区| 成人小视频免费看| 特一级黄色大片|