Spaghetti plot и Lasagna plot

Несмотря на близость биостатистики к точным наукам, в ней находится место для образных сравнений. Так, существуют способы визуализации данных с «кулинарными» названиями Spaghetti plot и Lasagna plot.
Spaghetti plot нередко используется в фармакокинетических и других продольных исследованиях. Он отражает результаты повторных измерений показателя для каждого субъекта в отдельности. Индивидуальные графики могут пересекаться и накладываться друг на друга, что делает рисунок похожим на тарелку спагетти.
Spaghetti plot может быть построен с помощью различного программного обеспечения (R, SAS, SPSS). Такие графики получаются наиболее наглядными при небольшом числе субъектов исследования. Если участники распределены по группам, целесообразно создавать отдельные Spaghetti plot для каждой из них.
Если субъектов исследования много, обилие индивидуальных графиков может выглядеть не очень эстетично и скрывать существующие тенденции. Кроме того, на Spaghetti plot неудобно отображать пропущенные данные.
В таких случаях на помощь исследователям приходит Lasagna plot. Он представляет собой гибрид Spaghetti plot и heatmap (тепловой карты) – способа отображения значений с помощью цвета.
  • В Spaghetti plot индивидуальные графики представлены двухмерными кривыми, поэтому могут пересекаться. При этом в каждой временной точке уровню оцениваемого показателя соответствует определенное положение на оси ординат (OY).
  • В Lasagna plot индивидуальные графики представлены отдельными горизонтальными слоями, как листы теста в лазанье. При этом в каждой временной точке уровню оцениваемого показателя соответствует определенный оттенок цветового градиента.
Превратить Spaghetti plot в Lasagna plot позволяет следующий алгоритм:
1) Исходный график раскладывается на отдельные индивидуальные графики.
2) Для каждого индивидуального графика меняется формат отображения зависимой переменной. В каждой временной точке значению зависимой переменной соответствует определенный цвет.
Например,
  • Диапазон значений [0-9) – красный
  • Диапазон значений [10-19) – оранжевый
  • Диапазон значений [20-29) – желтый
  • Диапазон значений [30-39) – зеленый
  • Диапазон значений [40-49) – голубой
3) Индивидуальные графики располагаются друг под другом.
Lasagna plot дает возможность оценивать общую картину, не теряя из виду отдельные наблюдения. Он позволяет поместить на один рисунок информацию по всей выборке, даже если предполагается деление на группы (в таком случае можно сортировать данные, расположив рядом графики субъектов из одной группы). Кроме того, в Lasagna plot удобно отображать пропущенные данные (например, с помощью белого цвета).
В то же время использование множества оттенков в Lasagna plot может перегружать зрительный анализатор и становиться проблемой для людей с нарушениями цветовосприятия. Чтобы такого не произошло, целесообразно подбирать палитру с учетом различных характеристик цвета (тон, яркость, насыщенность).
Как Spaghetti plot, так и Lasagna plot при своевременном применении и достаточном внимании к деталям могут стать ценными инструментами визуализации данных.
Источник 2: Swihart BJ, Caffo B, James BD, Strand M, Schwartz BS, Punjabi NM. Lasagna plots: a saucy alternative to spaghetti plots. Epidemiology. 2010 Sep;21(5):621-5. doi: 10.1097/EDE.0b013e3181e5b06a. PMID: 20699681; PMCID: PMC2937254.
Made on
Tilda