
Fachbeitrag zum Offline Reinforcement Learning im Dynamic Pricing erschienen
19 Juni 2025
Der Fachbeitrag "Improving network dynamic pricing policies through offline reinforcement learning", welcher in Kollaboration zwischen der Professur für Data Analytics & Statistics (Prof. Brieden) und der Professur für Business Analytics & Management Science (Prof. Steinhardt) entstanden ist, ist im OR Spectrum erschienen.
In der Forschungsarbeit wird mittels Offline Reinforcement Learning Algorithmen aus historischen Verkaufsdaten eine im Sinne der Erlösmaximierung bessere Pricing-Politik erlernt, als die Politik, die den Daten zugrunde liegt. Die Autoren zeigen damit erstmals auf typischen Benchmark-Netzwerken, wie das Reinforcement Learning auch im Dynamic Pricing erfolgreich eingesetzt werden kann. Offline-Verfahren haben gegenüber existierenden Online-Verfahren den großen Vorteil, dass keinerlei Interaktion mit der echten Welt erforderlich ist und damit der kostspielige Lernprozess von Online-Verfahren – aufgrund der notwendigen Exploration suboptimaler Preise – obsolet wird.
Die Open Access Publikation kann hier abgerufen werden.