[10184] Ошибка сохранения данных службы опроса после обновления на 3.45

Из журналов похоже, что ваш сервер просто не справляется с потоком данных и сохраняет их слишком долго. Дольше, чем требуется для остановки опроса, что и приводит к таким зависаниям. В журналах видно, что служба опроса успешно сохранила данные в 14:08, а сервер моментально поставил эти данные в очередь. Однако, за 20 минут сохранить их не удалось, что и привело к такому сбою.

У вас сервер доступен для подключения извне? Если да, мы можем снять метрики, чтобы проверить длину очереди и на что тратится время при сохранении данных.

Это может быть как проблема с производительностью компьютера, так и проблема с БД. Но для более детального анализа потребуются метрики.

Сообщите, пожалуйста, также характеристики вашего компьютера на котором расположен Сервер ЛЭРС УЧЕТ.
Уточните, СУБД SQL Server расположен на этом же ПК?

Просто ранее в версии 3.34 мы перешли на .NET Core, в ней был добавлен API Сервера ЛЭРС УЧЕТ и в последующей версии 3.35 в Сервер был внедрен Веб-интерфейс. Все это и другие изменения требуют в свою очередь значительной производительности компьютера. И судя по всему производительности вашего текущего компьютера не хватает.

В присланных вами журналах был замечен разрыв связи локальной Службы опроса с Сервером ЛЭРС УЧЕТ, что в том числе является причиной описанных вами ошибок. Такая ситуация часто возникала у наших пользователей при переходе на версию 3.34 и более поздних и связана она во всех известных нам подобных случаях с нехваткой ресурсов. Как минимум после увеличения производительности компьютера Сервера проблема в этих случаях переставала возникать.
У вас в данном случае как раз такая ситуация: вы обновились сразу с версии 3.07 R28.6 до текущей версии 3.45.2.

Система стоит на виртуальном сервере:


SQL стоит на этой же машине.
Диспетчер задач на версии 3.07, никаких затыков нет. SQL не съедает всю память, сервер ЛЭРС 139 мб.

При переходе на последнюю версию, SQL отъедает ~14Гб и сервер ЛЭРС ~1.4Гб. При этом невозможно даже открывать свойства точек учета, все стоит, ждал час. Пришлось остановить службу опроса и вручную проверить наличие автоопроса часовых значений у точек учета с МСД. Это наверное и был разрыв связи.

Про доступ извне еще можно узнать. Но мы не сможем перевести на новую версию сервер на длительное время без стабильной работы для внешнего наблюдения, производство не позволяет.

Размеры таблиц БД, на всякий случай.

Это немного. На нашей рабочей системе примерно так:

И это не самая большая из работающих систем.

Проблема в том, что данные с МСД 200 долго сохраняются, и причину без метрик, к сожалению, не получается понять.

Возможно, вы сможете на следующей неделе дать доступ хотя бы на пару часов в наше рабочее время? Это нам сильно поможет.

Возможно дать доступ через анидеск с 7 часов МСК на 4 часа. Развернем копию сервера с обновлением. Сейчас точную дату дать не могу, в понедельник буду уточнять.

Хорошо, ждем.

Пожалуйста, сразу после обновления до 3.45, сделайте настройки, которые нам позволят снять метрики:

  1. Добавьте в XML-файл C:\Program Data\LERS\Server\Lers.Server.xml следующий блок:
<telemetry>
	<MetricsEnabled>true</MetricsEnabled>
</telemetry>

Итоговый файл должен выглядеть примерно так:

<?xml version="1.0" encoding="utf-8"?>
<configuration>
	<network>
		<listenPort>10000</listenPort>
		<listenAddress></listenAddress>
	</network>
	<dataBase>
		<sqlServer>SERVER_ADDR</sqlServer>
		<dataBaseName>LERS</dataBaseName>
	</dataBase>

	<telemetry>
		<MetricsEnabled>true</MetricsEnabled>
	</telemetry>
</configuration>

  1. В системных параметрах на закладке “Безопасность” поставьте флажок “Разрешить просмотр результатов профилирования”.
  2. Перезапустите сервер ЛЭРС УЧЁТ.

Можете мне в личку скинуть адрес сервера, мы снимем нужные метрики.

У нас копия сервера (виртуальной машины с ОС, ЛЭРС, БД) с обновлением, отработала ~3 часа, на ней возможно провести это мероприятие или необходимо с нуля обновлять и сразу включать телеметрию?
Второй вариант не желателен, остановку сервера сложно запланировать на обновление, это дополнительное время, создание копии и обновление это примерно 4 часа.

К сожалению, телеметрия в БД не сохраняется, поэтому нужно запускать работу заново.

Согласовали 2 дня на этой неделе: завтра 13.04.2022 или в четверг 14.04.2022. Напишите когда вам удобнее и надо будет телефон по которому связаться. Когда установим обновление, для снятия телеметрии сообщить параметры доступа.

Давайте в четверг. Уточните, пожалуйста, время когда будет доступен сервер со включённой телеметрией.

По результатам сбора телеметрии будет проведена дополнительная работа для определения причины неадекватной работы службы опроса? Когда можно рассчитывать на рекомендации по обновлению?

Будем детально смотреть на следующей неделе. Если можно, приложите ещё журнал сервера за вчерашний день.

Проблема не в службе опроса, она отрабатывает штатно. Дело в том, что данные нескольких опросов сохраняются десятки минут, но конкретные запросы пока установить не удалось. Будем искать.

Отправил журналы в архиве на почту support@lers.ru.

Есть ли какие подвижки по телеметрии?

Добрый день!

Ещё смотрим. Проблема ясно видна по телеметрии, но, к сожалению, пока не получается найти конкретные запросы, которые останавливают систему на десятки минут.

Видно, что сервер весьма быстро обрабатывает все запросы, пока не начинается опрос нескольких десятков объектов, которые загружают очередь сохранения данных и не дают дальше двигаться опросу.

Нам нужно найти конкретную детализацию этих запросов. К сожалению, такой возможности в 3.45 у нас нет, поэтому, пробуем найти из того, что есть в журналах.