MCTSnet과 alphazero를 합칠 수 없을까 일단 생각이라도 해보자.1. readout network를 policy말고 value도 출력하게 하자.그다음 그 policy하고 value를 alphazero처럼 훈련시키자(KL, SSE)2. MCTS해서 나온 h(vector representation)을 embedding network에서 내놓게 훈련시키자(SSE) 3. simulation policy는 다음의 원칙에 따라 훈련시키자h_t값에 가장 큰 영향을 주는 것일수록 더 필수적인 search이다 4. backup network는 그냥 MCTSnet에서 건의한것처럼 깊은 SGD를 해서 훈련시켜야 할듯(1번하고 통합될지도) 더보기 도대체 endorsement인가 뭔가가 뭐야? 더보기 친구가 나한테 낸 문제. 재미있는 함수방정식실수 평면에서 실수평면으로 가는 전단사함수 f가 다음 조건을 만족한다.f에 의해 직선은 직선으로 대응 된다.1)함수 f를 구하여라2)실수 평면이 아닌 실수 사영 평면인 경우(즉, 사영평면애서 사영평면으로) 구하여라3)실수 공간(3차원)인 겨우 구하여라(즉, 실수 공간에서 실수 공간으로..)4)실수 사영 공간에서 실수 사영 공간으로 가는 경우... 더보기 이전 1 2 3 4 5 다음 목록 더보기