...

Elma недоступна (InternalError)

Тема в разделе "Администрирование On-Premises", создана пользователем denis.fondikov, 10 фев 2025.

Метки:
  1. denis.fondikov

    denis.fondikov Участник

    Добрый день.
    Столкнулись с проблемой - веб-страница Elma перестала быть доступна, перезагрузка ни к чему не привела.
    Откатили из бекапа на 2 недели назал / на месяц - результат один и тот же.
    Версия Elma - On-premisses 2013-10-16.
    Образ в докере запущен:
    upload_2025-2-10_15-16-29.png

    с виду в логе контейнера ошибок не видно:
    upload_2025-2-10_15-17-49.png


    Диагностика проблем ссылается на Внутренюю ошибку:
    upload_2025-2-10_15-19-36.png

    upload_2025-2-10_15-20-16.png

    Подскажите, пожалуйста, может кто-то сталкивался с таким и знает как починить / оживить?
    Заранее спасибо!
  2. shalavin

    shalavin Новичок

    Добрый день!
    Похожее поведение для Kind поставки может наблюдаться в случае истечения срока действия внутренних сертификатов Kubernetes, возможное решение в данном случае использование флага --renew-certs-k8s для скрипта установки:
    ./elma365-docker.sh --renew-certs-k8s
    Обновление сертификатов Kubernetes происходит при обновлении системы, также данный процесс автоматизирован в новых версиях Elma365 без выполнения обновления.
  3. denis.fondikov

    denis.fondikov Участник

    В моем случае такой опции нет в скрипте установки :(
    [​IMG]
  4. shalavin

    shalavin Новичок

    На старых версиях системы, действительно, может еще не быть такого флага.
    Еще одним возможным решением является переupgrade площадки на текущую версию при помощи флага --upgrade, в данном случае ELMA365 будет полностью перезапущена вместе с контейнером.
    После восстановления работы рекомендуется выполнить обновление до LTS версии, на актуальных версиях системы исключили подобные ошибки с истечением срока действия сертификатов в Kind поставке.
  5. denis.fondikov

    denis.fondikov Участник

    Да, попробовал выполнить обновление, но в процессе обновления ругается - "Error from server (InternalError): an error on the server ("") has prevented the request from succeeding.
    И после этого контейнер поднимается, но Web-ресурс все равно не достпен, но уже с другой ошибкой:
    [​IMG]
  6. shalavin

    shalavin Новичок

    Добрый день!
    В случае, если у вас сохранен дамп данных можно воспользоваться флагом --reset:
    ./elma365-docker.sh --reset
    В таком случае, все данные системы будут удалены и будет установлена новая чистая версия системы. После чего можно будет выполнить восстановление данных.
    Если нет риска потери данных и нет цели сохранить текущее состояние системы - самым простым вариантом будет установка новой актуальной версии системы.

    Если же дампа нет и данные необходимо сохранить, необходимо проваливаться в контейнер elma365 и проводить диагностику неисправности самого кластера.
    На данный момент видим, что ошибка с которой вы сталкиваетесь указывает на то, что API сервер kubernetes по какой-то причине не может обработать запрос. На старых версиях Kind наиболее вероятно, что это происходит из за истечения срока действия сертификатов kubernetes.
    Путь до сертификатов в контейнере с k8s-кластере:
    /etc/kubernetes/pki/
    Проверить, какие сертификаты и ключи используются на уровне процессов API-сервера:
    ps aux | grep kube-apiserver
    Необходимо проверить срок действия сертификатов и обновить при необходимости.
  7. denis.fondikov

    denis.fondikov Участник

    У нас нет такой директории.
    Сертификаты в контейнере докера обновили, которые в корне, в пути ./certs/, но это не помогло.
    Дамп собрать не можем, т.е. ругается на эту же ошибку..
  8. denis.fondikov

    denis.fondikov Участник

    Нашли контейнер Kubernetes, вложенный в контейнер Docker.
    Обновили сертификаты там по указанному пути (/etc/kubernetes/pki/), но это никак не повлияло на работу системы - так и не доступна.
    Как обновили - обновили (сделали это на клоне системы) версию до билда от ноября 2014 года, вытащили сертификаты оттуда, и уже пробросили в версию не обновленную.
    Есть такой вывод
    docker exec elma365 helm list -a
    Error: Kubernetes cluster unreachable: Get "https://127.0.0.1:39267/version": x509: certificate signed by unknown authority (possibly because of "crypto/rsa: verification error" while trying to verify candidate authority certificate "kubernetes")