Sanctuary Garden: 公平和抉擇

2022年11月30日星期三

公平和抉擇

現代社會講求公平，也把公平視為普世價值。雖然「公平」是一個我們應該爭取的目標，但它顯然不是社會的現實。

由出生開始，人生就是不公平的。我們無法選擇自己的父母，成長的地方和時代。而且這些不可控的環境因素對我們日後的人生都有着巨大的影響。明白事理的父母，穩定的家庭經濟，和因而產生的良好教育和成長環境，能讓我們有更大的發展空間。年幼時的朋輩壓力，和周遭親友的事業成就，也影響我們的自我期許，以及我們對「平凡」的量度界線。更不論天生的外表樣貌等等，會對人生的走向有多大的影響。

雖然我們可以埋怨人生的不公，甚至有時以此作手段爭取權益能帶來一些好處。但終究大環境我們沒有辦法可以控制，怨天尤人也無補於事。世上有兩類人會很強調人生不公這回事。第一類是以此作為自己不努力的藉口，因為既然起跑線遠遠落後於人，努不努力結果也相差無幾，自然放棄也無所謂了。第二類是本身得天獨厚，有着各種先天好處的人。如果起跑線決定命運，當然幸運的他們就能輕鬆地領先到終點，自然他們樂意繼續宣揚人生不公這個論調。但對大部份沒有出生在特別優厚的環境，但又未至於要完全放棄的人來說，人生究竟公平還是不公平，只是一個既有的現象，和需要解決的問題。和其他人生種種需要解決的問題一樣，沒有什麼太大不了。

在研究人工智能和決擇的學科中，有一個分支叫 reinforcement learning (RL)。它的目的就是要尋找在各個環境下，如何透過不同試驗的結果去學得最佳的行動策略。在研究中，學者會把把小小的電腦程式放在不同的虛擬環境裏，然後透過不同的策略去從失敗中學習，最終獲得解決問題的最佳方法。reinforcement learning 和真實的人生有很多相似的地方，例如很多時我們無法知道環境的全貌，只能透過不斷嘗試去觀察什麼行為會導致什麼結果。在未知的環境裏，透過以往的觀察和適當的策略去尋求更好的選擇。

RL要解決的問題和真實的人生很類似，它得出來的策略也有很多值得參考的地方。那些用以摸擬的小小電腦程式，一開始時無法決定自己在什麼環境開始，很多時它們都只是隨機地被放到某個境況之中。但無論一開始的環境是如何不公，那些小程式仍然只會冷靜地執行有效的策略。因為只要某個行動能改善現狀，那總比什麼不做要好。就這樣慢慢地累積微小的進步，然後在某一刻就能走出厄運的深谷，突然海闊天空豁然開朗。

RL的實驗，就像是把無數的人生選擇都已經試驗過，然後得出在大部份情況下的最優解。當然不幸仍然會發生，也有機會一開始就遇到死胡同，但只要不是遭遇太過災難性的不幸，總是有辦法慢慢走到終點。它有許多有啟發性的策略，例如要保持樂觀，選擇一個能夠給你最好結果的選項；要記着以往的經驗，作為未來的參考，儘量從別人身上學習，避免自己走冤枉路等等。可能許多只是老生常談，但其實也是無數實驗過後得到的可靠結果。一個人的經歷和時間是有限的，世事又有不確定性，即使你按着最佳的策略行動，也不能保證一定就有最佳的結果。我們可以肯定的只是在統計學上，如果按照最佳的策略行動，不斷嘗試之後，成功的機會總會更高。所以與其埋怨人生的種種不公，不如花更多時間去思考最適合現今處境的策略，然後看輕個別事件的得失，用心在過往的經歷中學習，增加下次成功的機會。

再埋怨人生的不公也是無補於事。更重要的是我們有什麼方法能走出這不幸的深淵，和在每個分岔道，如何冷靜有耐性地做出最佳的選擇，就像那些無比堅毅的小小電腦程式一樣。

2 則留言:

星塵2022年12月4日下午2:24
對啊，到最終我們為人生唯一抗衡的辦法，也不過是重複試錯，然後找一個比較好的路去行就是了
回覆刪除
回覆

新增留言