Tip:
Highlight text to annotate it
X
약간의 기본적인 용어를 소개하는 것이 좋을 것 같습니다.
일반적으로 해당 용어들은 인공지능에서 여러가지 다른 유형의 문제를 구별하는데 사용됩니다.
여러분께 가르칠 첫 번째는 '완전 관찰가능/부분 관찰가능하다'라는 단어입니다.
어떤 환경이 완전 관찰 가능(fully observable)하다는 것은, 당신의 에이전트가 감지하는 것이
언제가 됐든, 최적의사결정(optimal decision)을 내리기에 완벽히 충분함을 말합니다.
예를 들어, 여러 번의 카드 게임에서
모든 카드가 탁자 위에 올려졌을 때, 카드가 놓인 그 순간의 장소는
최적의 선택을 하는데 확실히 충분한 것이 됩니다.
이러한 완전 관찰 가능한 환경은 다른 '기억이 필요한' 환경-
즉, 가능한 최선의 결정(best possible decision)을 내리기 위해 에이전트에 대한 기억이 필요한 환경과는 대비됩니다.
예를 들어, 카드가 탁자 위에 공개되지 않는 포커 게임의 경우,
과거의 수를 기억해두는 것은 당신이 더 나은 결정을 내리는데 도움이 될 것입니다.
이 차이를 완벽하게 이해하기 위해, 에이전트와 주변 환경의 상호 작용이
감지기와 작동기를 통해 이루어지는 것을 생각해봅시다.
상호 작용은 여러 번의 주기를 통해 나타납니다.
보통 인지 활동 주기라고 불리는 그것이지요.
다수의 환경에서는 다음과 같이 가정하는 것이 편리한데,
'주변 환경은 일련의 내부 상태를 가지고 있다.'는 것입니다.
카드들이 탁자 위에 공개되지 않는 카드 게임을 예로 들면,
환경의 내부 상태는 아마도 당신 손에 있는 카드와 연관되겠지요.
감지기가 한 환경의 전체 상태를 언제나 볼 수 있다면,
그 환경은 완전 관찰 가능한 것입니다.
감지기가 환경 상태의 일부만을 볼 수 있다면, 그 환경은 부분 관찰 가능(partial observable)한 것입니다.
하지만 지난 관측 결과를 기억하고 있으면 부분 관찰 가능한 환경에서
지금 즉시는 관찰 가능할 수 없는 내부 상태에 대한 추가 정보를 얻게 됩니다.
그래서, 예를 들어 어떤 게임이든 과거의 움직임에
어떤 사람이 한 행동에 대한 정보가 담겨있다면, 그 게임들은 부분 관찰 가능하고
완전 관찰 가능한 환경과는 다른 대처 방식이 필요하게 됩니다.
부분 관찰 가능한 환경을 다루는 에이전트들은 보통
내부 저장 공간이 요구되는데, 그 이유는
주변 환경의 내부 상태가 어떤지 이해하기 위해서입니다.
이 주제는 우리가 은닉 마르코프 확률 모형(hidden Markov model)에서
모형의 구조가 어떻게 내부 저장 공간을 가지는지 이야기할 때 광범위하게 다루게 될 것입니다.
주변 환경을 다루는 두 번째 용어는
환경이 결정적인지, 아니면 확률적인지에 대한 것입니다.
결정적(deterministic)인 환경에서는 에이전트의 행동이
특정 결과로 유일하게 결정됩니다.
예를 들어 체스의 경우, 당신이 말을 움직일 때는 정말 우연의 여지가 없습니다.
말을 움직인 결과는 완벽하게 예정되어 있고,
제가 같은 말을 어디로 움직이려 하든, 그 결과는 같습니다.
이것을 우리는 결정적이라고 합니다.
백개먼(backgammon) 같이 주사위로 하는 게임들은 확률적(stochastic)입니다.
여전히 당신의 말을 결정적으로 움직일 수는 있습니다만
그 행동의 결과는 주사위를 던지는 것도 포함되고,
이는 예측할 수 없습니다.
주사위를 던지는 결과에는 일정한 임의성이 나타나기 때문에,
우리는 이것을 확률적이라고 합니다.
이산성과 연속성에 관해서 이야기해 봅시다.
이산적(discrete)인 환경에서 여러분은 한정된 여러가지 행동 선택지와
감지할 수 있는 한정된 것들을 가지게 됩니다.
다시 한 번 체스 게임을 이야기하면, 체스판의 칸은 한정되어 있고
당신이 할 수 있는 것들은 한정되어 있습니다.
이는 연속적(continuous)인 환경과는 다릅니다.
연속적 환경에서는 가능한 행동이나 감지 가능한 것들의 공간이 무한합니다.
예를 들어 당신이 다트를 던진다면, 다트를 기울이고 속도를 더하는 데에는
무한하게 많은 방식이 존재하지요.
마지막으로, 양성적 환경과 적대적 환경을 구분해야 합니다.
양성적(benign) 환경에서 주변환경은 임의성을 가질 수 있습니다.
환경이 확률적일 수는 있지만,
자신에게 반대하는 대상을 목표로 삼진 않습니다.
예를 들어, 날씨는 양성적인 환경입니다.
날씨는 임의성을 띄고, 당신 행동의 결과에 영향을 줄 수도 있습니다.
하지만, 당신에게 영향을 주려고 거기에 있는 것은 아닙니다.
양성적 환경에 비해, 체스와 같은 여러 게임들의 적대적(adversarial)인 환경에서
상대는 정말 당신에게 영향을 주기 위해 존재합니다.
적대적인 환경 아래 이득을 보는 방법을 찾는 것은 정말 어렵습니다.
상대는 능동적으로 당신을 관찰하고 목표로 하는 것을 얻지 못하게 방해합니다.
양성적인 환경에서 환경은 단지 확률적인 문제일 뿐
당신의 활동에 악영향을 끼치는 데엔 관심이 없던 것과 비교하면 분명하지요.
이제, 이 표현들을 여러분이 어디까지 이해했는지를
다음 테스트를 통해 보도록 합시다.
여기 네 개의 개념을 다시 적겠습니다. 부분 관찰 가능 대 완전 관찰 가능,
확률적 대 결정적, 연속성 대 이산성,
적대적 대 양성적.
체커 게임에 관하여 물어볼까 합니다.
알맞은 특성을 한 가지 또는 모두 선택하세요.
만약 체커 게임이 부분 관찰 가능하다고 생각되면 이 항목에 표기를,
그렇지 않으면 표기하지 않으시면 됩니다.
확률적이라면 이 항목을,
연속적이라면 이 항목을, 적대적이라면 이 항목을 표기하시면 됩니다.
체커 게임에 대해서 모르신다면, 웹 사이트들을 확인하고 검색하여
체커 게임에 대한 정보를 더 찾아보셔도 좋습니다.