Siirry päänavigointiin Siirry hakuun Siirry pääsisältöön

Optimal sensing via multi-armed bandit relaxations in mixed observability domains

  • Mikko Lauri
  • , Risto Ritala

    Tutkimustuotos: KonferenssiartikkeliTieteellinenvertaisarvioitu

    6 Sitaatiot (Scopus)
    44 Lataukset (Pure)

    Abstrakti

    Sequential decision making under uncertainty is studied in a mixed observability domain. The goal is to maximize the amount of information obtained on a partially observable stochastic process under constraints imposed by a fully observable internal state. An upper bound for the optimal value function is derived by relaxing constraints. We identify conditions under which the relaxed problem is a multi-armed bandit whose optimal policy is easily computable. The upper bound is applied to prune the search space in the original problem, and the effect on solution quality is assessed via simulation experiments. Empirical results show effective pruning of the search space in a target monitoring domain.

    AlkuperäiskieliEnglanti
    Otsikko2015 IEEE International Conference on Robotics and Automation (ICRA), 26-30 May 2015, Seattle, WA
    Sivut4807-4812
    Sivumäärä6
    Vuosikerta2015-June
    DOI - pysyväislinkit
    TilaJulkaistu - 29 kesäk. 2015
    OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisussa
    TapahtumaIEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION -
    Kesto: 1 tammik. 19001 tammik. 2000

    Conference

    ConferenceIEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION
    Ajanjakso1/01/001/01/00

    Julkaisufoorumi-taso

    • Jufo-taso 1

    !!ASJC Scopus subject areas

    • Software
    • Artificial Intelligence
    • Control and Systems Engineering
    • Electrical and Electronic Engineering

    Sormenjälki

    Sukella tutkimusaiheisiin 'Optimal sensing via multi-armed bandit relaxations in mixed observability domains'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

    Siteeraa tätä