Regression

Arbeitsgruppe 8.42

Beschreibung

Regressionsprobleme entstehen in vielen metrologischen Anwendungen. Hierzu zählen zum Beispiel alltägliche Kalibrationsaufgaben (siehe Anhang H.3 des Opens external link in new window GUM), die Auswertung von Ringvergleichen, die Charakterisierung von Sensoren [Matthews et al., 2014], die Bestimmung von Elementarkonstanten [Bodnar et al., 2014] sowie Interpolations- und Prognoseprobleme [Wübbeler et al., 2012]. Regressionen dienen dabei der Schätzung des funktionalen Zusammenhangs zwischen Variablen.

Gaußsche Regression — **Abb.1**: Illustration eines typischen linearen Regressionsproblems mit normalverteilten Messfehlern. Dargestellt sind die mittlere Regressionskurve (durchgezogenen Linie) und dessen punktweise 95% Überdeckungs- intervalle (gestrichelte Linien). Die dünne vertikale Linie zeigt die Prognose an einem neuen x-Wert und sein 95% Überdeckungsintervall. Die Punkte repräsentieren die Messdaten.

Definition und Beispiele

Regressionsprobleme haben oft die Form

$$
\begin{equation*}
y_i = f_{\boldsymbol{\theta}}(x_i) + \varepsilon_i , \quad i=1, \ldots, n \,,
\end{equation*}
$$

das heißt, die Messungen $\boldsymbol{y}=(y_1, \ldots, y_n)^\top$ werden beschrieben durch eine Funktion $f_{\boldsymbol{\theta}}$, die an den Werten $\boldsymbol{x}=(x_1, \ldots, x_n)^\top$ berechnet wird und von unbekannten Parametern $\boldsymbol{\theta}=(\theta_1, \ldots, \theta_p)^\top$ abhängt. Dem Messfehler $\pmb{\varepsilon}=(\varepsilon_1, \ldots, \varepsilon_n)^\top$ werden Wahrscheinlichkeiten aus einer Verteilung $p(\pmb{\varepsilon} | \boldsymbol{\theta}, \boldsymbol{\sigma})$ zugeordnet.

Regressionen können beispielsweise die Beziehung zwischen einem rückführbaren, hochgenauen Referenzgerät mit Werten $x$ und einem zu kalibrierenden Gerät mit Werten $y$ beschreiben. Die Paare $(x_i,y_i)$ bezeichnen dann die simultanen Messungen, die die zwei Geräte für die gleiche Messgröße anzeigen, zum Beispiel für die Temperatur.

Ein einfaches Beispiel ist die Gaußsche Geradenregression (siehe Abb. 1)

$$
\begin{equation} \label{int_reg_eq1}
y_i = \theta_1 + \theta_2 x_i + \varepsilon_i , \quad \varepsilon_i \stackrel{iid}{\sim} \text{N}(0, \sigma^2), \quad i=1, \ldots, n \,.
\end{equation}
$$

Das grundlegende Ziel von Regressionsaufgaben ist die Schätzung der unbekannten Parameter $\pmb{\theta}$ der Regressionsfunktion und möglicherweise auch der unbekannten Parameter $\pmb{\sigma}$ der Fehlerverteilung. Sind diese Regressionsparameter geschätzt, kann die Form der Regressionskurve ausgewertet, Prognosen für inter- oder extrapolierende $x$-Werte erstellt oder die Regressionsfunktion umgekehrt werden, um $x$-Werte neuer Messungen vorherzusagen.

Nach oben

Forschung

Entscheidungen, die auf Regressionsanalysen basieren, erfordern eine zuverlässige Auswertung der Messunsicherheiten. Der gegenwärtige Stand der Unsicherheitsauswertungen in der Metrologie (siehe GUM und seine Ergänzungen) ist für Regressionen jedoch wenig geeignet. Ein Grund ist, dass die GUM-Richtlinien auf einem Model basieren, welches die Messgröße direkt aus den Eingangsgrößen ableitet. Regressionsmodelle lassen sich jedoch nicht eindeutig durch solche Messfunktionen beschreiben. Anhand eines Beispiels schlägt Annex H.3 des GUM trotzdem eine Möglichkeit zur Analyse von Regressionsproblemen vor. Diese Auswertung beinhaltet sowohl Elemente aus der klassischen Statistik (kleinste Quadrate) als auch der Bayesschen Statistik, so dass die Ergebnisse nicht auf "state-of-knowledge" Verteilungen basieren und sich im Allgemeinen von einem rein klassischen oder rein Bayesschen Ansatz unterscheiden, wie in [ Opens external link in new window Elster et al., 2011] gezeigt wurde.

Auf dem Gebiet der Unsicherheitsberechnung für Regressionsprobleme werden in der Metrologie deshalb Richtlinien und zusätzliche Forschung benötigt. Das Joint Committee for Guides in Metrology (JCGM) erkennt diesen Bedarf an. Im Rahmen des EMRP-Projektes NEW04 [ Initiates file download Elster et al., 2015] wurden unter Leitung der PTB Arbeitsgruppe 8.42 Richtlinien für die Bayessche Inferenz von Regressionsproblemen erarbeitet. Diese Richtlinie enthält auch Musterlösungen für spezifische Regressionsprobleme mit bekannten Werten x. Sie kann auf der Opens external link in new window Internetseite des NEW04-Projektes kostenlos heruntergeladen werden. Für Regressionsprobleme mit Gauß-verteilten Messfehlern und linearer Regressionsfunktion (siehe Formel (1)) werden in [Klauenberg et al., 2015_2] Hinweise gegeben, wie für eine Bayessche Analyse auf extensive numerische Berechnungen (z.B. Markov Chain Monte Carlo Methoden) verzichtet werden kann.

Häufig beinhalten Regressionsprobleme auch Unsicherheiten in den x-Werten. Im Rahmen des EMPIR Projektes Opens external link in new window 17NRM05 EMUE wurden drei übertragbare Beispiele entwickelt, die verschiedene Aspekte der Anpassung von Geraden illustrieren:

Für die GUM-konforme Kalibrierung von Ultraschalldüsen wird in [Martens et.al., 2020a] demonstriert, wie alle beteiligten Unsicherheiten quantifiziert werden können. Zudem wird die Wichtigkeit betont, vorhandene Korrelationen zu berücksichtigen.
Anhand von zwei Verfahren zur Messung von Hämoglobin wird in [Martens et.al., 2020b] die Quantifizierung von Unsicherheiten beim Methodenvergleich demonstriert. Insbesondere wird beispielhaft gezeigt, wie Korrelationen berücksichtigt werden können und wie sie Schätzwerte und Unsicherheiten der Regression beeinflussen.
Für die Kalibrierung eines Drehmomentmesssystems und bekannte x-Werte werden in [Martens et.al., 2020c] die Ansätze nach GUM und Bayes verglichen. Der Bayesschen Ansatz wird empfohlen, da die Variabilität der Beobachtungen wenig bekannt und unterschiedlich sein kann. Explizite Formeln werden angegeben.

Außerdem werden in der PTB Arbeitsgruppe 8.42 Untersuchungen zu metrologischen Anwendungen durchgeführt, in denen Regressionsprobleme auftreten. Zum Beispiel

für Analysen in der Magnetfeldfluktuationsthermometrie, wird in [Wübbeler et al., 2012] ein Bayesscher und in [Opens external link in new windowWübbeler et al., 2013] ein vereinfachter Ansatz zur Interpolation und Prognose vorgeschlagen und validiert,
für Analysen in der Magnetfeldfluktuationsthermometrie, wird in [Wübbeler et al., 2012] ein Bayesscher und in [Wübbeler et al., 2013] ein vereinfachter Ansatz zur Interpolation und Prognose vorgeschlagen und validiert,
für die Bestimmung von Elementarkonstanten, wird in [Bodnar et al., 2014] eine sogenannte objektive Bayessche Inferenz entwickelt und mit der oft angewandten Birge ratio Methode verglichen,
für die Analyse von immunologischen Tests (ELISA), werden in [Klauenberg et al., 2015] informative prior-Verteilungen konstruiert, die vielfältig anwendbar sind,
für die Kalibrierung von Durchflussmessgeräten, wird in [Kok et al., 2015] eine Bayessche Analyse betrachtet, die auch Randbedingungen der Regressionskurve berücksichtigt.

Nach oben

Software

Software

Nach oben

Publikationen

Artikel

Titel:	Informative prior distributions for ELISA analyses
Autor(en):	K. Klauenberg, M. Walzel, B. Ebert;C. Elster
Journal:	Biostatistics
Jahr:	2015
Band:	16
Ausgabe:	3
Seite(n):	454--64
DOI:	10.1093/biostatistics/kxu057
ISSN:	1468-4357
Web URL:	http://biostatistics.oxfordjournals.org/content/16/3/454
Marker:	Regression, 8.42, ELISA
Zusammenfassung:	Immunoassays are capable of measuring very small concentrations of substances in solutions and have an immense range of application. Enzyme-linked immunosorbent assay (ELISA) tests in particular can detect the presence of an infection, of drugs, or hormones (as in the home pregnancy test). Inference of an unknown concentration via ELISA usually involves a non-linear heteroscedastic regression and subsequent prediction, which can be carried out in a Bayesian framework. For such a Bayesian inference, we are developing informative prior distributions based on extensive historical ELISA tests as well as theoretical considerations. One consideration regards the quality of the immunoassay leading to two practical requirements for the applicability of the priors. Simulations show that the additional prior information can lead to inferences which are robust to reasonable perturbations of the model and changes in the design of the data. On real data, the applicability is demonstrated across different laboratories, for different analytes and laboratory equipment as well as for previous and current ELISAs with sigmoid regression function. Consistency checks on real data (similar to cross-validation) underpin the adequacy of the suggested priors. Altogether, the new priors may improve concentration estimation for ELISAs that fulfill certain design conditions, by extending the range of the analyses, decreasing the uncertainty, or giving more robust estimates. Future use of these priors is straightforward because explicit, closed-form expressions are provided. This work encourages development and application of informative, yet general, prior distributions for other types of immunoassays.

Zurück zur Listen Ansicht

Nach oben

Regression

Inhalt

Beschreibung

Definition und Beispiele

Forschung

Software

Publikationen

Publikations Einzelansicht

Artikel