Condor

Logiciel capture d'écran:
Condor
Détails logiciels:
Version: 7.8.3
Date de transfert: 20 Feb 15
Développeur: Condor Authors
Licence: Gratuit
Popularité: 22

Rating: 2.0/5 (Total Votes: 1)

Condor est maintenant influencée par les défis technologiques et sociologiques d'un tel environnement informatique,
Condor équipe a construit des outils extraordinaires qui permettent aux scientifiques et ingénieurs d'augmenter leur production informatique

Ce qui est nouveau dans cette version:.

    < li> 7.6.x est la nouvelle série Condor stable.
  • Beaucoup de nouvelles fonctionnalités ont été ajoutées depuis 7.4.x.

Ce qui est nouveau dans la version 7.3.2:

  • Notes de version:
  • Le format de la sortie de condor_status avec l'option -grid a été modifié pour fournir des informations plus utiles.
  • Suppression de la nouvelle ligne ajoutée à la fin de la production condor_status -format. Par conséquent, le code qui analyse la sortie de cette commande devrait maintenant être prudent lors de la coupe de la dernière ligne.
  • Nouvelles fonctionnalités:
  • condor_fetchlog peut maintenant récupérer les fichiers d'un démon condor_schedd d'histoire. Et, le fichier d'historique tenu par le démon condor_schedd peut désormais être tournée quotidienne ou mensuelle.
  • Le condor_ckpt_server nettoie automatiquement les fichiers de point de contrôle obsolètes. Les variables de configuration qui contrôlent ce comportement sont décrites ci-dessous.
  • Le condor_ckpt_server (soit 32 bits ou 64 bits) exécutable va maintenant communiquer correctement entre 32-bit et 64-bit soumettre nœuds. Si par bit de chances questions largeur surviennent dans le protocole de point de contrôle (par exemple, avec des tailles de fichiers), les messages d'erreur clairs sont enregistrés dans les journaux du serveur de point de contrôle.
  • Le nouvel outil de débogage interactif permet condor_ssh_to_job d'emplois en cours d'exécution. Voir la page de manuel au [*] pour plus de détails.
  • La commande condor_status est maintenant sensiblement plus rapide, surtout avec l'option -format.
  • univers Grille type de grille de GT5 a été ajouté à l'intention du nouveau service Globus GRAM5. Quand un service de GRAM est identifié comme GT5, jobmanager étranglement et le moniteur Grille ne sont pas utilisés. Voir la section 5.3.2 pour plus de détails.
  • Grille univers crème type de grille a été ajoutée pour la soumission au service de l'emploi de crème de gLite. Voir la section 5.3.8 pour plus de détails.
  • Lorsque faible sur les descripteurs de fichiers pour créer de nouveaux sockets réseau, le démon condor_schedd évite maintenant l'empilage illimitée jusqu'à des messages qu'il envoie périodiquement au condor_negotiator et condor_startd.
  • La performance et l'échec manipulation du moniteur Grille ont été améliorées.
  • Pour le type de grille nordugrid dans l'univers de la grille, les informations d'état des travaux est maintenant obtenue en utilisant le serveur LDAP de nordugrid ARC, ce qui devrait grandement améliorer les performances. Aussi, Condor peut maintenant dire quand ces travaux sont en cours.
  • La nouvelle option -valgrind à condor_submit_dag les causes condor_submit_dag pour générer un fichier de description présenter qui utilise valgrind sur condor_dagman, au lieu de le binaire condor_dagman que son exécutable.
  • condor_dagman évalue maintenant paresseusement et ouvre les fichiers journaux de l'emploi de nœuds. Au lieu d'analyser tous soumettre des fichiers de description et d'ouvrir immédiatement leurs fichiers journaux spécifiés au démarrage, condor_dagman analyse maintenant le fichiers de description soumettre juste avant chaque travail est soumis, et a chaque fichier ouvert journal uniquement lorsque emplois pertinents sont dans la file d'attente ou l'exécution de scripts POST . En outre, maintenant condor_dagman génère automatiquement un fichier journal utilisateur par défaut pour tout travail de noeud qui ne spécifie pas une.
  • la fois le support et la documentation de l'univers MPI ont été supprimés. Applications MPI sont pris en charge grâce à l'utilisation de l'univers parallèle.
  • Lorsque le test de démon condor_startd de logiciel de machine virtuelle échoue (pour les machines configurées comme capable d'exécuter des machines virtuelles), le condor_startd périodiquement réessayer le test jusqu'à ce qu'il réussisse.
  • Le nordugrid_gahp limite désormais le nombre de connexions effectuées à chaque serveur nordugrid ARC et réutilise les connexions lorsque cela est possible.
  • Ajout de la fonction eval ClassAd (), qui prend un argument de chaîne et évalue le contenu de la chaîne comme une expression ClassAd. Un exemple de la politique lorsque cela est utile est décrit à la section 3.5.9 sur la suspension de l'emploi.
  • La nouvelle option de condor_q -attributes limite les attributs qui sont affichés lorsque vous utilisez le -xml ou des options -Long. Limiter le nombre d'attributs augmente également l'efficacité de la requête.
  • les capacités de gestion de l'alimentation de Condor sont maintenant mis en œuvre comme un plug-in. En particulier, le condor_startd dirige maintenant un programme externe, comme spécifié par la configuration HIBERNATION_PLUGIN variable pour effectuer la détection des états disponibles de faible puissance et la commutation à ces états de faible puissance.
  • Le nouveau condor_rooster démon Condor a été ajouté à réveiller machines hibernation lorsque l'expression définie par la configuration UNHIBERNATE variable devient vrai. Les variables de configuration relatives à condor_rooster sont décrites à la section 3.3.35.
  • Ajout de la possibilité d'extraire des informations de l'état de la mémoire tampon de l'utilisateur journal des événements lecteur à la lecture du journal de l'utilisateur. Ceci est réalisé grâce à une nouvelle classe C ++ ReadUserLogStateAccess tel que défini dans read_user_log.h.
  • Les modifications apportées à la valeur de la configuration CERTIFICATE_MAPFILE variable ou le contenu du fichier auquel il se réfère ne ont plus besoin d'un redémarrage complet du Condor. Au lieu de cela, la commande condor_reconfig entraînera les changements qui doivent être utilisés.
  • Le démon condor_master imprime alors le chemin et des arguments à tous les démons qu'il démarre si D_FULLDEBUG est activée. Auparavant, il n'y avait aucun moyen de l'obtenir pour afficher les arguments avec lesquels il commençait un démon.
  • Le démon condor_had a maintenant la capacité de contrôler les démons autres que le condor_negotiator. Ce est contrôlée par la macro HAD_CONTROLLEE.
  • Condor reconnaît maintenant voms extensions de procurations X.509. Les attributs de voms sont codés dans le travail ClassAd attribuer X509UserProxySubject.
  • Le condor_startd peut maintenant nettoyer les machines virtuelles bloqués, à la suite d'un accident du Condor ou de son système d'exploitation hôte.
  • Après un accident, le condor_gridmanager ne redémarre tous les emplois pour jobmanagers GT2. Cela devrait améliorer le temps de récupération.
  • Condor fonctionne mieux avec les classads classés comme générique dans le démon condor_collector. Divers démons qui se inscrivent auprès classads génériques peuvent maintenant avoir des outils qui utilisent l'option -subsystem manipuler leurs classads correctement.
  • Condor offre désormais un mécanisme pour faire appliquer ressources stricte limitant pour certains univers d'emplois en cours d'exécution.
  • Configuration ajouts variables et modifications:
  • La nouvelle variable de configuration EMAIL_SIGNATURE spécifie une signature personnalisée à ajouter à l'e-mail envoyé par le système Condor. Si définie, cette signature personnalisée remplace celui par défaut spécifié à l'interne. Il n'y a aucune valeur par défaut pour cette variable.
  • La nouvelle configuration CKPT_SERVER_CLIENT_TIMEOUT variables informe les condor_schedd combien de temps en secondes qu'il est prêt à attendre pour essayer de parler à un processus de condor_ckpt_server avant de déclarer un condor_ckpt_server bas. Voir la section 3.3.11 pour la description complète.
  • La nouvelle variable de configuration CKPT_SERVER_CLIENT_TIMEOUT_RETRY informe le condor_schedd qu'une fois condor_ckpt_server est été marqué comme inactif, comment peuvent secondes doivent se écouler avant que l'condor_schedd va essayer de communiquer avec le condor_ckpt_server nouveau. Voir la section 3.3.11 pour la description complète.
  • La nouvelle variable de configuration CKPT_SERVER_REMOVE_STALE_CKPT_INTERVAL informe le condor_ckpt_server pour commencer le retrait de points de contrôle obsolètes à l'intervalle spécifié en secondes. Voir la section 3.3.8 pour la description complète.
  • La nouvelle variable de configuration CKPT_SERVER_STALE_CKPT_AGE_CUTOFF informe le condor_ckpt_server quel âge le temps d'accès d'un fichier point de contrôle doit être pour être considéré comme périmé. Ce temps est comparée à la notion actuelle de maintenant, quand le serveur checkpoint vérifie le fichier d'image de point de contrôle. Voir la section 3.3.8 pour la description complète.
  • La nouvelle configuration SlotWeight variable peut être utilisée pour donner une fente plus de poids lors du calcul de l'utilisation, le calcul de la juste part, et de faire respecter les quotas groupe. Voir 3.3.10 pour la description complète.
  • La nouvelle variable de configuration MAX_PERIODIC_EXPR_INTERVAL met en œuvre un plafond sur le temps entre l'évaluation des expressions périodiques, en raison du calendrier adaptative implicite par la configuration PERIODIC_EXPR_TIMESLICE variable. Voir 3.3.11 pour la description complète.
  • La nouvelle configuration GRIDMANAGER_SELECTION_EXPR variable peut être utilisé pour contrôler le nombre de processus condor_gridmanager sera engendré pour gérer les travaux de l'univers de la grille. Dans le cadre de ce changement, retiré la variable de configuration et le code de support pour GRIDMANAGER_PER_JOB depuis la nouvelle variable de configuration le remplace. Voir 3.3.11 pour la description complète.
  • La configuration GRIDMANAGER_MAX_PENDING_SUBMITS_PER_RESOURCE variable et les GRIDMANAGER_MAX_PENDING_SUBMITS étranglement correspondants ont été supprimés.
  • La nouvelle configuration des contrôles de GRID_MONITOR_DISABLE_TIME variable de combien de temps le condor_gridmanager attendra après avoir rencontré une erreur avant de tenter de redémarrer un travail Grille Monitor. Voir 3.3.23 pour la description complète.
  • La nouvelle configuration macro DETECTED_MEMORY prédéfini indique la quantité de mémoire physique (RAM) détectée par Condor. La valeur est donnée en Mo.
  • Les nouvelles DETECTED_CORES macro configuration prédéfinis indique le nombre de cœurs de processeurs détectés par Condor.
  • Les variables contrôles DELEGATE_FULL_JOB_GSI_CREDENTIALS nouvelle de configuration si un proxy complet ou limité X.509 est déléguée pour le type de grille emplois de l'univers de la grille GT2. Voir 3.3.26 pour la description complète.
  • La nouvelle configuration UNHIBERNATE variable est utilisée par le condor_startd faire de la publicité dans son ClassAd une expression booléenne spécifiant quand la machine doit être réveillé, par exemple en condor_rooster. Voir 3.3.10 pour la description complète.
  • La nouvelle variable de configuration HIBERNATION_PLUGIN spécifie le chemin vers le plug-in qui utilise à la fois l'condor_startd pour détecter les faibles capacités d'état d'alimentation d'une machine et de mettre la machine à un état de faible puissance. Voir 3.3.10 pour la description complète.
  • La nouvelle configuration HIBERNATION_PLUGIN_ARGS variable spécifie les arguments de ligne de commande supplémentaires que le condor_startd passera au plug-in lors de l'appel à mettre la machine à un état de faible puissance. Voir 3.3.10 pour la description complète.
  • La nouvelle configuration HIBERNATION_OVERRIDE_WOL variable peut être utilisée pour diriger le condor_startd d'ignorer Wake On LAN (WOL) capacités de l'interface réseau de la machine, et de passer à un état d'alimentation faible, même si l'interface ne prend pas en charge WOL, ou si WOL est désactivé sur elle. Voir 3.3.10 pour la description complète.
  • Les variables nouvelle configuration des contrôles de DAGMAN_USER_LOG_SCAN_INTERVAL combien de temps condor_dagman attentes entre la vérification des fichiers journaux d'emploi pour les mises à jour de statut. Voir 3.3.25 pour la description complète.
  • La nouvelle variable de configuration DAGMAN_DEFAULT_NODE_LOG définit le nom du fichier journal par défaut pour la nouvelle fonctionnalité de fichier journal de noeud condor_dagman par défaut. Voir 3.3.25 pour la description complète.
  • Suppression des DAGMAN_DELETE_OLD_LOGS variables de configuration; nouveau code fichier journal de lecture, il est obsolète.
  • La nouvelle variable de configuration HAD_CONTROLLEE est utilisé pour spécifier le nom du démon qui les commandes de condor_had. Ce nom doit correspondre au nom du démon dans le liste_démons du condor_master.
  • Bugs fixe:
  • Correction d'un bug dans les fonctions ClassAd où les arguments qui auraient dû être correctement contraints à cordes à la place évalués pour erreur.
  • Correction d'un message de diagnostic de la confusion avec l'JobRouter, qui se est produit quand un travail a été enlevé dans les 5 minutes après avoir été soumis.
  • Correction d'un bug dans lequel l'utilisation des créneaux dynamiques (voir la section 3.13.7) ont causé les ClassAd machine attribuent SLOT_STARTD_ATTRS à disparaître de la ClassAd pour certains créneaux.
  • Correction d'un bug de plate-forme Windows dans lequel la fenêtre appartenant à un emploi Condor ne reçoit pas un message de peinture.
  • Correction d'un bug provoquant condor_q -Analyser se écraser quand il n'y avait pas de fichier condor_schedd démon ClassAd.
  • Correction d'un crash de condor_procd causé lorsque l'environnement d'un processus suivi a dépassé 1 Mo dans / proc.
  • Correction d'un bug de plate-forme Windows qui pourrait causer l'condor_credd planter si un diplôme demandée ne est pas dans le magasin de mot de passe.
  • Correction d'un bug qui faisait que le verrou de rotation du journal des événements de l'emploi doit être créé avec des autorisations incorrectes.
  • Correction d'un bogue dans la rotation du journal des événements de l'emploi qui pourrait l'amener à ne jamais être tourné dans le port de Windows Condor.
  • Correction d'une condition de concurrence potentielle dans l'initialisation d'emploi du journal des événements.
  • condition de course fixe qui pourrait causer un accident de la condor_collector et condor_schedd à l'arrêt.
  • Correction d'un bug dans lequel le condor_master serait parfois mourir et produire un fichier dprintf_failure.MASTER lorsque soit redémarrer en raison de nouveaux horodateurs binaires ou quand il commence d'abord.
  • Correction d'une fuite de mémoire liée à des variables de configuration SOAP qui se est produite lorsque Condor a été reconfiguré.
  • Correction d'un bug dans lequel le fichier de description présenter commande cron_day_of_week a été ignoré à tort.
  • Correction d'un bug où les variables de configuration et MAX_JOB_QUEUE_LOG_ROTATIONS GRIDMANAGER_SELECTION_EXPR ne fonctionnerait pas correctement au démarrage; ils ne ont travaillé après une condor_reconfig.
  • Correction d'un bug dans lequel les opérations SOAP ont été autorisés à tort avec l'IP par les pairs.
  • Correction d'un bug de plate-forme Windows dans lequel tous les démons Condor ont été approuvé par le pare-feu Windows (précédemment connu sous le pare-feu de connexion Internet ou ICF).
  • Correction d'un état de course d'arrêt dans le condor_master à l'égard de démons de haute disponibilité.
  • Correction d'un bug où un démon Condor mal a déterminé qu'il ne avait plus de prise descripteurs.
  • Correction d'un bug où le condor_schedd serait bloquer pendant de très longues périodes de temps tout en essayant de se connecter à un serveur de point de contrôle vers le bas. Maintenant, le condor_schedd fera un blocage connecter avec un délai d'attente sur le serveur point de contrôle pour un nombre configurable de seconde. Si la connexion échoue, le condor_schedd mettra un moratoire sur la connexion au serveur de point de contrôle jusqu'à ce que les passes configurables de la période de moratoire. Les variables de fichiers de configuration qui décrivent ce comportement sont décrites ci-dessus.
  • a changé le chèque qui condor_dagman fait pour d'autres cas condor_dagman exécutant le même DAG, se il trouve un fichier de verrouillage au démarrage. Maintenant, si condor_dagman ne est pas sûr que l'autre Dagman est vivant, il continue, plutôt que de quitter.
  • Correction d'une fuite majeure descripteur de fichier dans le démon Stork.
  • Correction d'un bug dans lequel les transferts de Stork réussies ont été marquées comme ayant échoué.
  • Correction d'un rare fuite de mémoire dans le code fichier journal de lecture de l'événement de l'utilisateur lors de la lecture des événements mal formatés.
  • Correction d'un bug dans lequel plusieurs classads machine dans le condor_collector avec le même nom, mais différentes valeurs d'attribut de StartdIPAddr, provoqueraient l'condor_negotiator pour quitter avec une erreur. Ce est inhabituel et ne devrait pas se produire dans une installation typique Condor. La cause la plus probable utilise condor_advertise faire de la publicité personnalisés classads la grille matchmaking.
  • Correction d'un bug qui causait à condor_dagman core dump si tout soumettre tentatives ont échoué sur un nœud de DAG ayant un script POST. Ce bogue a existé depuis la version 7.1.4 Condor.
  • Correction d'une fuite mémoire dans le condor_schedd, qui se est produite lorsque la configuration NEGOTIATOR_MATCH_EXPRS variable a été utilisée.
  • Correction d'un bug dans le code de plate-forme Windows qui traite les scripts comme exécutables. Extensions de fichiers inconnus ont été traités comme une erreur, plutôt que comme un exécutable Windows.
  • Le condor_job_router définit maintenant correctement le ClassAd attribut EnteredCurrentStatus à l'heure actuelle lors de la création d'un nouvel emploi en déroute. Auparavant, il copié cet attribut de la tâche d'origine.
  • Le condor_job_router émet un message de journal plus convivial quand il observe que la copie acheminé du travail a été supprimé.
  • Un correctif a été fait pour un problème vu dans 7.3.1 dans laquelle démons Condor utilisant CCB de se connecter à d'autres démons Condor serait parfois consommer de grandes quantités de temps CPU pour aucune bonne raison.
  • Correction d'un bug de cas de défaillance rare dans laquelle tente de se connecter via CCB pourrait rester dans un état d'attente indéfiniment.
  • Une Unix seulement bug causé démons Condor à ne parviennent pas à démarrer si MAX_FILE_DESCRIPTORS a été configuré plus élevé que la limite dure actuelle héritée par Condor. Si Condor se exécute en tant que root, ce ne est plus le cas.
  • Le condor_gridmanager annonce maintenant classads de la grille correctement quand il ya plusieurs démons condor_collector.
  • Lorsque vous utilisez condor_q -xml et -format ensemble pour limiter le nombre de ClassAd attributs retourné dans la requête, la balise conteneur XML n'a pas été généré. Ceci est corrigé, mais maintenant la meilleure façon de limiter les attributs retournés est d'utiliser -attributes d'options condor_q.
  • Correction d'un bug dans lequel le condor_master Unix échoué en essayant de se relancer, si la configuration MASTER_LOCK variable a été définie, ou si la condor_master a été invoquée avec l'option -t. Ce bogue a existé depuis la série 7.0, et probablement a existé beaucoup plus longtemps que cela.
  • Correction d'une fuite mémoire importante dans le gahp_server. Cette fuite ne était présent que dans les précédentes versions 7.3.x Condor.
  • Correction d'un bug qui peut causer un emploi supprimé qui a lieu, puis relâché pour revenir à l'état de repos.
  • Les fichiers jar Globus distribués avec le x86-64 RHEL 5 RPM ont été endommagés, causant des emplois de type GT4 de la grille à l'échec. Ceci a été corrigé.

Quoi de neuf dans la version 7.2.2:

  • Ajout d'un port plein de Condor à Debian 5.0 sur la plate-forme x86.
  • Ajout d'un port écrêté de Condor à Debian 5.0 sur la plateforme x86_64.
  • Ajouté le drapeau de ligne de commande -DumpRescue à condor_dagman et condor_submit_dag. Ce drapeau est principalement destiné aux essais.
  • Ajout du support pour l'option -debug à condor_qedit.
  • Le routeur d'emploi utilise maintenant une minuterie de tranche de temps pour l'évaluation de l'expression périodique, semblable au démon condor_schedd. L'intervalle d'évaluation est contrôlée par la configuration PERIODIC_EXPR_INTERVAL variable et par défaut à 60 secondes, la même valeur par défaut utilisé par le démon condor_schedd.
  • Le routeur emploi réinitialise désormais la tâche source, si une panne se produit lorsque la mise à jour le démon condor_schedd pour une expression périodique évaluée à True. Expressions périodique de l'emploi doivent être évaluées à nouveau un certain temps à l'avenir avec une mise à jour réussie.

Ce qui est nouveau dans la version 7.2.0:.

  • Les principales améliorations de fonctionnalités

Ce qui est nouveau dans la version 7.0.5:

  • Cette version contient de nombreuses corrections de bugs et quelques améliorations à l'erreur manipulation des emplois univers local.
  • Notez que certaines des corrections de bogues sont liés à la sécurité; par conséquent, les sites doivent soit mettre à jour ou de restreindre les autorisations sur qui est autorisé à soumettre des travaux Condor aux utilisateurs de confiance.

Logiciel similaire

OpenNebula
OpenNebula

20 Feb 15

iRODS
iRODS

14 Apr 15

Lustre
Lustre

11 May 15

mrjob
mrjob

20 Feb 15

Commentaires à Condor

Commentaires non trouvées
Ajouter un commentaire
Tourner sur les images!