星期二, 30 12 月, 2025
https://download-betway.com

最 受 歡 迎

麥當勞薯條與解決禿頭有關?日本科學家在老鼠身上試驗成功了

吃了那麼多年薯條,從沒想過有一天,它能跟治病扯上關係,況且可治癒的還是讓年輕人避之唯恐不及、中年人困擾不已的病症──禿頭,這聽起來就更讓人意外了。

艾德華福隆將回歸演出《魔鬼終結者:黑暗宿命》約翰康納

轉載從: 開眼電影網艾德華福隆將回歸演出《魔鬼終結者:黑暗宿命》約翰康納 2019聖地牙哥動漫展(Comic-Con)如火如荼展開,詹姆斯卡麥隆驚喜宣布曾在《魔鬼終結者2》中飾演小約翰康納的艾德華福隆,也將回歸演出《魔鬼終結者:黑暗宿命》。 ...

Google 和加州大學柏克萊分校的新式 Actor-Critic 演算法,快速在真實世界訓練機器人

相比傳統方式需要工程人員手動設計機器人每個動作的精確參數,AI 時代的研究人員有全自動化、廣闊前景的新學習方式:深度強化學習可讓機器人從經驗、與世界的互動直接學習行為,因為可藉助通用化的神經網路表示,處理複雜的感測器輸入。然而,許多現有的強化學習演算法都需要幾天、幾週甚至更久時間的真實世界數據,才能收斂到比較理想的動作。更重要的是,這樣的系統很難在複雜的機器人系統使用(比如多足機器人)。系統的探索學習過程很容易會損傷到機器人的零件,同時還難以調節超參數,許多安全方面的考量也可能帶來更多限制。近期,Google AI 與加州大學柏克萊分校合作研發一種新的強化學習演算法 Soft Actor-Critic(SAC)。這是一種穩定、高效的深度強化學習演算法,高度符合機器人實驗的需求,也非常適合真實世界的機器人技能學習。重點是,SAC 的學習效率夠高,可在數小時內學會解決真實世界的機器人問題,且同一套超參數可在多種不同環境工作。Google AI 撰寫部落格文章介紹了 SAC 背後的研究工作,也介紹了相關實驗結果。在真實世界學習機器人的要求真實世界的機器人實驗有一些重大挑戰,比如硬體失效和人工重置會導致數據流中斷,以及需要讓探索學習過程平滑,避免快速機械磨損或撞擊破壞,這都對演算法理論和演算法實現增加額外的限制,包括以下(但不限於): 有較高的樣本效率,以降低學習時間。 需要調節的超參數數量盡量少。 能在不同的場景重複使用已採集的數據(也稱為「無策略學習」)。 確保探索學習過程不損壞硬體。 Soft Actor-CriticSoft Actor-Critic 是基於最大熵強化學習開發的,這是一種嘗試讓預期回報最大化(標準的強化學習目標),同時也讓策略的熵最大化的框架。熵更高的策略有更高隨機性,直覺看來,這意味著最大熵強化學習會學習取得高回報的策略中,具最高隨機性的策略。為什麼在機器人學習這是件好事呢?明顯的原因是,最大熵優化的策略會更強健:如果策略在訓練過程中能允許高度隨機的動作,那麼它在測試時候也就更有可能順利應付預期外的擾動。不過更穩當的理由是,最大熵訓練不僅提高演算法對超參數的強健性,也可以提高採樣效率。Soft Actor-Critic 會學習一個隨機策略,這個策略會把狀態映射到動作及一個...

要做好腦機介面技術,馬斯克和祖克柏還需破解大腦密碼

最近腦機介面概念掀起了一陣熱潮。Facebook 的團隊宣稱,要不了多久我們就能用意念打字,透過皮膚來聆聽了。另外,根據艾隆‧馬斯克(Elon Musk)的說法,我們將很快實現上傳和下載思維。

美 FDA 批准 2 項新冠病毒血液篩檢,可知道患者是否曾經感染

美國食藥局(FDA)近日通過兩項針對武漢肺炎(COVID-19,新冠肺炎)的血液篩檢授權,與過往判斷確診與否的檢驗不同,這兩項新測試將能讓患者得知以前是否曾感染過新冠病毒,還可以推算出體內的大概還有多少抗體存在。

精子銀行出包,美 40 男子提告

過去偶有銀行因為保險箱之中的物品遺失而挨告的案例,不過,精子銀行也會挨告?苦主是芝加哥的西北紀念醫院(Northwestern Memorial Hospital)與西北大學醫學院教學人員基金會(Northwestern Medical Faculty Foundation),西北紀念醫院才剛在《美國新聞與世界報導》(US News & World Report)年度評選最佳醫院排行榜中奪得第 6 名,卻遇上這場官司,可說有點尷尬。

電影

時尚

科技新知

近期文章

Instagram

melbet