OpenFacet

О методологии OpenFacet и DCX

OpenFacet — это прозрачная структура для создания гладких, объяснимых ценовых матриц для бриллиантов на основе наблюдаемых рыночных данных. Она опирается на лог-линейную регрессию по структурированным кортежам карат–цвет–чистота, фиксируя градиенты цен, исключая при этом нерелевантные или ненадежные данные.

Основные принципы:

  • Бриллианты с сертификатом GIA1, круглой огранки, 3EX2 (огранка, полировка, симметрия), без флуоресценции
  • Гранулярность модели соответствует стандартным диапазонам карат (например, 0.30–0.39 карат)
  • Интерполированные цены с использованием сглаживания в лог-пространстве по диапазонам карат
  • Конкурентоспособный ценовой минимум, основанный на наименьшей публично доступной розничной цене
  • Реконструированные матрицы соответствуют ограничениям монотонности3 (лучшие градации не должны стоить дешевле)

DCX Composite предоставляет эталон для розничных цен на бриллианты, алгоритмических стратегий, оценки синтетических активов и количественного анализа рынка.

Источники данных

Цены собираются из складов ведущих онлайн-ретейлеров. Источники должны:

  • Публиковать SKU розничного уровня с полными данными GIA (огранка, цвет, чистота, карат, ID сертификата)
  • Предоставлять актуальные или часто обновляемые цены

Мы исключаем поставщиков с непоследовательными ценами, агрессивным кэшированием или стандартами сертификации, отличными от GIA.

Логика выбора цен

Чтобы избежать нерепрезентативных выбросов, мы выбираем вторую или третью наименьшую цену за карат для определенных градаций чистоты (FL–VS1: вторая; VS2–SI2: третья) на основе рыночного поведения, поскольку самые низкие цены за карат могут отражать нетипичные камни или ошибки в листингах. Этот метод обеспечивает конкурентоспособные, но стабильные розничные цены, балансируя доступность и целостность ценообразования.

В случаях, когда требуемая комбинация цвет–чистота отсутствует в текущем окне наблюдения, система применяет ограниченный исторический поиск, запрашивая прошлые листинги (до пяти дней назад) для нахождения действительных цен, соответствующих правилам выбора. Этот подход, аналогичный методам переноса последней наблюдённой цены, используемым в финансовых индексах, таких как BCOM, обеспечивает непрерывность построения матрицы без искусственного сглаживания или оценки. Учитываются только публично указанные цены — интерполяция или синтетические цены на этом этапе не используются. Отфильтрованный набор цен затем передаётся в логику реконструкции матрицы.

Реконструкция ценовой матрицы

Для каждого диапазона карат мы реконструируем полную ценовую матрицу цвет × чистота с использованием модели лог-линейной регрессии. Розничные листинги неполны — многие комбинации цвет/чистота не имеют недавних предложений, особенно в сегментах с низким спросом.

Мы предполагаем, что в пределах фиксированного диапазона карат лог-цена бриллианта $\log(p)$ изменяется плавно в зависимости от цвета и чистоты. Каждое известное наблюдение кодируется как:

  • $i$: числовой индекс цвета (D=0, E=1, …, J=6)
  • $j$: числовой индекс чистоты (IF=0, VVS1=1, …, SI2=6)
  • $y = \log(p)$: лог-трансформированная цена предложения

Мы подгоняем модель вида:

$$ \log(p_{i,j}) = \beta_0 + \beta_1 \cdot (i - \bar{i}) + \beta_2 \cdot (q_j - \bar{q}) $$

Где:

  • $\bar{i}, \bar{q}$: центрированные индексы (цвет, обратная чистота)
  • $q_j$: оценка качества чистоты (IF → высокая → большое $q$)
  • $\beta_0, \beta_1, \beta_2$: коэффициенты регрессии, полученные методом наименьших квадратов

Мы ограничиваемся бриллиантами GIA с отличной огранкой, чтобы изолировать эффекты цвета и чистоты.

Нелинейная корректировка остатков

В случаях с достаточной плотностью данных мы применяем корректировку второго этапа с использованием ALS4 (чередующихся наименьших квадратов). Это подгоняет модель низкого ранга к остаткам между фактическими лог-ценами и начальной регрессией, фиксируя нелинейные эффекты, упущенные начальной регрессией. Это улучшает локальную подгонку без ущерба для интерпретируемости модели.

Этот гибридный подход создаёт стабильные, гладкие и выровненные по данным ценовые поверхности, подходящие для дальнейшего моделирования.

Сглаживание между каратами и обеспечение монотонности

После создания опорных матриц для каждого диапазона карат (через лог-линейную регрессию и ALS) мы применяем второй этап сглаживания по значениям карат. Это повышает согласованность между соседними диапазонами и корректирует шум выборки или нерегулярные листинги, которые могут вызывать инверсии цен за карат.

Мы реализуем два последовательных преобразования:

Ядерное сглаживание (между каратами)

Для каждой ячейки цвет–чистота $(i, j)$ мы сглаживаем цены по каратам, используя гауссово-взвешенное среднее в лог-пространстве:

$$ \log P_c^{(i,j)} = \frac{\sum_k K(c, c_k) \cdot \log P_{c_k}^{(i,j)}}{\sum_k K(c, c_k)} \quad \text{с} \quad K(c, c_k) = \exp\left(-\frac{(c - c_k)^2}{2\sigma^2}\right) $$

Где:

  • $c_k$: опорные диапазоны карат (например, 0.30, 0.40, …, 6.00)
  • $\sigma$: ширина сглаживания, обычно 0.10 карат
  • $P_{c_k}^{(i,j)}$: оценка лог-цены при карате $c_k$, цвете $i$, чистоте $j$

Это обеспечивает плавные переходы через пороги карат (например, 0.99 против 1.00 карат) и подавляет локальные аномалии.

Монотонная регрессия (по ячейкам)

После сглаживания мы обеспечиваем монотонность по каратам для каждой ячейки $(i,j)$:

$$ \log P_{c_1}^{(i,j)} \leq \log P_{c_2}^{(i,j)} \leq \cdots $$

Это выполняется с использованием изотонической регрессии через алгоритм объединения соседних нарушителей (PAVA). Он гарантирует невозрастающую последовательность лог-цен по каратам.

Поскольку бриллиант меньшего веса может быть вырезан из более тяжелого с идентичной градацией, цены за карат не должны уменьшаться с увеличением веса.

В качестве защиты от артефактов округления или побочных эффектов ядра мы применяем финальный строгий этап ограничения. Если:

$$ \log P_{c_k}^{(i,j)} < \log P_{c_{k-1}}^{(i,j)} $$

мы принудительно устанавливаем $P_{c_k}^{(i,j)} := P_{c_{k-1}}^{(i,j)}$.

Модель интерполяции цен

Мы рассматриваем цену как гладкую, лог-трансформированную функцию от карат, цвета и чистоты. Из-за нелинейной природы ценообразования бриллиантов — особенно в отношении веса в каратах — наша система использует лог-линейную интерполяцию в ценовом пространстве, а не простое линейное усреднение.

Стандартизированные ценовые матрицы вычисляются для каждого отраслевого диапазона карат (например, 0.30–0.39 карат, 0.40–0.49 карат, …, 2.0–2.99 карат), каждая из которых структурирована как матрица по цвету (D–J) и чистоте (IF–SI2).

Для интерполяции матрицы при любом промежуточном значении карат $c$ в диапазоне $[c_1, c_2]$ мы применяем геометрическую интерполяцию между двумя опорными матрицами $P_1$ и $P_2$:

$$ P_c(i,j) = \exp\left((1 - \lambda) \cdot \log P_1(i,j) + \lambda \cdot \log P_2(i,j)\right) $$

где:

  • $P_c(i,j)$: интерполированная цена при карате $c$, цвете $i$, чистоте $j$
  • $P_1, P_2$: опорные ценовые матрицы при $c_1, c_2$
  • $\lambda = \frac{c - c_1}{c_2 - c_1}$
  • $i, j$: индексы по цвету и чистоте
  • Вся интерполяция выполняется в лог-пространстве для отражения мультипликативного масштабирования в рыночном поведении

Этот метод гарантирует, что цены отражают реальные ограничения предложения: более высокий вес в каратах увеличивает цену за карат из-за эффектов редкости, а не только общей цены веса.

Интерполированные матрицы используются для визуального отображения, аналитического моделирования и построения индекса (например, Diamond Composite Index). Публикуются только сглаженные, лог-трансформированные выходные данные, основанные на публичных розничных данных.

DCX: Индекс композитных цен на бриллианты

DCX — это синтетический ценовой индекс, полученный из матриц OpenFacet, предназначенный для отслеживания тенденций розничных цен на бриллианты для эталонного и финансового использования.

Примечание по визуализации: Вклад спецификаций, показанный в визуальных отображениях (например, гистограммах), основан на чистой взвешенной долларовой стоимости: карат × цена за карат × вес, масштабированной относительно наибольшего вклада. Это отличается от расчёта DCX, который использует сглаженные, интерполированные цены за карат и нормализованные веса.

Обоснование индекса: В отличие от товарных индексов (например, BCOM), которые используют арифметическое среднее по биржевым фьючерсам, DCX следует конструкции геометрического среднего, подобной потребительским индексам в стиле Джевонса. Это отражает мультипликативную природу ценообразования бриллиантов, где увеличение качества или веса в каратах умножается, а не складывается. Формулировка лог–эксп также снижает чувствительность к выбросам и обеспечивает более плавное, согласованное с масштабом поведение для спецификаций с большим разбросом цен.

Методология построения:

  • Эталонная корзина: Количество спецификаций балансирует стабильность индекса с чувствительностью к рыночным изменениям; обновляется ежеквартально.
  • Веса: Назначаются по оценочному глобальному объёму × ценовому обороту; периодически перебалансируются.
  • Источник цен: Каждая спецификация относится к уникальной комбинации карат, цвета и чистоты (предполагается градация GIA, 3EX и отсутствие флуоресценции).

Индекс вычисляется как взвешенное геометрическое среднее цен за карат:

$$ DCX_t = \exp\left( \frac{\sum w_i \cdot \log P_{i,t}}{\sum w_i} \right) $$

где $P_{i,t}$ — оценочная цена за карат спецификации i в момент времени t, а $w_i$ — её вес.

Эта формулировка вычисляет геометрическое среднее интерполированных цен за карат, взвешенное по обороту спецификаций. Геометрическое среднее снижает влияние выбросов и соответствует мультипликативному поведению ценообразования бриллиантов по градациям и размерам.

Эта конструкция обеспечивает:

  • Устойчивость к выбросам (лог-среднее сглаживает всплески)
  • Репрезентативность по диапазонам карат, цвета и чистоты
  • Интерпретируемость для финансовых или синтетических сценариев использования активов

DCX опирается исключительно на матрицы, построенные с использованием публично указанных розничных цен. Лабораторные или несертифицированные камни не включаются. DCX пересчитывается ежедневно и публикуется с полной прозрачностью на уровне спецификаций.


  1. GIA — Геммологический институт Америки, отраслевой стандарт градации. ↩︎

  2. 3EX — Тройное превосходство: отличные оценки по огранке, полировке и симметрии в отчёте GIA. ↩︎

  3. Ограничения монотонности — гарантируют, что цены не увеличиваются при снижении качества (например, худший цвет или чистота). ↩︎

  4. ALS — Чередующиеся наименьшие квадраты: итерационная техника факторизации матриц, используемая для подгонки остатков. ↩︎