클래스: 인공지능 소개

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,100개를 수강하세요.

Reinforcement learning

Reinforcement learning

- 온라인 음악 산업의 규모는 300억 달러에 이릅니다. 그리고 생각해보면 좀 이상한 사업이에요. Apple Music Spotify, Tidal에서 같은 노래를 구입할 수 있는 경우가 많습니다. 그렇다면 왜 다른 서비스보다 하나의 서비스에 가입하고 싶게 될까요? 대부분의 사람들에게 이는 추천 시스템의 힘과 관련이 있습니다. 이러한 시스템 중 다수는 비지도 머신러닝을 사용하여 시작되었습니다. 그들은 온라인 소매업체가 자주 함께 구매되는 물건을 보여주는 것과 같은 방식으로 노래를 추천하죠. 그러나 최고의 음악 라이브러리는 단지 함께 물건을 구입하기를 바라는 것이 아니라, 많은 라이브러리에서 여러분이 새로운 것을 발견하기를 바라죠. 따라서 이를 위해서는 다른 형태의 머신러닝을 사용해야 합니다. 이것을 머신러닝의 강화 학습이라고 하죠. 새로운 패턴을 찾을 수 있도록 시스템에 인센티브를 제공하는 방법으로 보상을 사용하는 머신러닝 알고리즘입니다. 몇 년 전 Google은 강화 학습을 사용하여 인공지능 시스템에 비디오 게임을 하는 방법을 가르쳤습니다. 그들의 AI 시스템은 Pong Atari 및 훨씬 더 현대적인 비디오 게임의 전문 플레이어를 능가했습니다. 그러나 강화 학습은 단순히 비디오 게임을 하는 것보다 훨씬 더 많은 일을 할 수 있습니다. 이러한 시스템은 일련의 목표와 보상을 설정해 시간이 지남에 따라 개선될 수 있습니다. 이런 식으로 생각해 보세요. Spotify Discover Weekly는 여러분이 좋아하는 노래를 여러 관련 노래와 비교합니다. 머신러닝 알고리즘은 노래를 클릭하고 재생할 때마다 경로를 추적합니다. 또한 얼마나 오랫동안 듣는지 추적합니다. 데이터 과학자들은 관련 노래를 클릭할 때마다 작은 디지털 보상을 받도록 알고리즘을 설계합니다. 머신러닝 시스템에서 돈과 비슷한 개념인 것이죠. 추천곡을 클릭하면 보상 코인을 받을 수 있습니다. 그러면 사용자가 오래 들을수록 보상이 커지므로 노래를 듣는 1분마다 보상 코인을 얻게 됩니다. 이러한 알고리즘은…

목차