Проблема со службой опроса

Периодически перестаёт работать служба опроса. Выглядит это так:


После перезагрузки сервера или перезапуска службы опроса ЛЭРС УЧЕТ начинает нормально работать. Проблема возникает иногда несколько раз за день, иногда раз в несколько дней. Помогите, пожалуйста, найти причину.

Приложите, пожалуйста, журнал работы Сервера и Службы опроса ЛЭРС УЧЕТ за день, уогда произошло отключение Службы опроса от Сервера.

Вчера, когда уходил с работы, опрос работал. Сегодня утром обнаружил, что опрос не работает. Не могу точно определить, когда опрос остановился, вчера или сегодня. Поэтому прилагаю журналы за два дня.
PollService.7z (2.1 МБ)
Server.7z (8.7 МБ)

Мы проанализировали присланные журналы работы обеих служб. Как видно из них каждая из служб теряет соединение с противоположной стороной, а значит причина потери соединения не в них. Возможно антивирус, брандмауэр / фаэрвол или подобное ПО, регулирующее подключение других программ, вмешивается в работу служб, разрывая соединение между ними.

Также подобная ситуация может возникать, когда Служба опроса и Сервер находятся на одном компьютере, как в вашем случае, и при этом ресурсов компьютера не хватает обеим службам или одной из них для своевременной обработки запросов активности подключения. Дело в том, что службы проверяют активно ли подключение друг с другом и если подтверждения не приходит, то соединение считается утерянным. А при нехватке ресурсов компьютера время обработки таких запросов может увеличиться и выходить за рамки ожидания своевременного ответа на них.

Как видно из присланных вами журналов, активность обеих служб довольно высокая. Вполне возможно, что в пики такой активности ресурсов компьютера не хватает и это приводит к потере соединения в результате несвоевременного подтверждения активности подключения между службами.
Такие случаи у нас были ранее у некоторых пользователей и переход на более мощный ПК помогал в решении такой проблемы.

Проверьте оба варианта.

Ещё заметил, что сервер у вас иногда не отвечает на запросы больше 30 секунд. Это тоже может привести к разрыву подключения.

Возможно, у вас не хватает производительности серверного компьютера, и во время интенсивного опроса он начинает отвечать на запросы намного дольше, что и приводит к разрывам.

Попробуйте запустить монитор ресурсов и подождать воспроизведения ситуации. Если я прав, в момент разрывов связи нагрузка на ЦП будет 100%

как определить по логам время, когда перестает работать связь между службой опроса и службой сервера?

В журнале работы службы опроса после утери подключения пишется строка

Утеряно подключение к серверу.

Можете посмотреть время, когда такое событие фиксировалось.

Сегодня ночью такое сообщение появлялось несколько раз. Это значит, что подключение к серверу иногда самостоятельно восстанавливается. Но почему не всегда?
Еще вопрос, вот такое сообщение к моей проблеме не относится?

> 2022-10-10 14:01:34.5567 W:-1 Lers.PollService.PollService Утеряно подключение к серверу. The remote party closed the WebSocket connection without completing the close handshake.

Вполне возможно, что из-за нехватки производительности Сервер ЛЭРС УЧЕТ отработал некорректно и подключение Службы опроса было обработано неправильно или необработано вовсе. В данном случае, если вопрос стоит именно в нехватке производительности и/или ресурсов компьютера, на котором установлены Сервер и Служба опроса, необходимо все же попробовать увеличить его производительность.

Данное сообщение частный случай ошибок потери соединения.

Какой компьютер нужен для сервера (сервер ЛЭРС, служба опроса, sql сервер) на 500 объектов учета? Посмотрел здесь

Суммарное количество объектов учета и помещений в жилых домах Объем оперативной памяти Объем места на жестком диске для журналов
50 4 Гб 500 Мб
500 8 Гб 3 Гб
  • Процессор – 1600МГц или выше.
    Эти требования уже устарели?

В данном разделе отражены примерные характеристики. В среднем их достаточно для нормальной работы ЛЭРС УЧЕТ, но при большой загруженности Сервера ЛЭРС УЧЕТ необходимо подбирать индивидуальные характеристики его компьютера, позволяющие Серверу своевременно обрабатывать все запросы при этой загруженности.
Вы можете временно заказать виртуальный сервер VDS/VPS, разместив на нем Сервер ЛЭРС УЧЕТ и подобрав тем самым необходимые характеристики компьютера и выбрать по ним уже физический компьютер. Так делали многие пользователи, столкнувшиеся с подобной же проблемой.

Остался без ответа мой вопрос

Заметил, что служба опроса перестает часто работать тогда, когда происходит бекап базы данных, или когда я архиватором сжимаю файл бекапа. Но в обычном режиме загрузка процессора 10-15 процентов. Почему если из-за пиковой загрузки процессора соединение между службой сервера и службой опроса разорвалось, то его нельзя автоматически восстановить через некоторое время, когда нагрузка на процессор упадёт?

Соединение автоматически восстанавливается. То, что служба после перезагрузки не смогла активировать порты могло быть связано с какой-то ошибкой обращения к БД. Попробуем найти в журнале почему это произошло.

Вы здесь о каком сервере пишете? Не отвечает служба “ЛЭРС УЧЕТ - Сервер” на запрос от службы опроса, или не отвечает SQL сервер на запрос службы опроса?

Сервер на запрос от службы.

который сервер из двух не отвечает: ЛЭРС-сервер или SQL-сервер?

Ошибка была от таймауте на запрос от службы опроса к серверу ЛЭРС. Возможно, что произошла она из-за долгого ответа sql server. Или сам сервер ЛЭРС сильно занят. Мы посмотрим журналы и скажем.

Похоже, проблема всё-таки в том, что в моменты разрыва связи компьютер загружен на 100%. Пожалуйста, проверьте это с помощью утилиты windows perfmon.msc. Вы можете поставить на запись загрузку ЦП и проверить когда она была пиковой. Скорее всего, пики совпадут с разрывами связи.