Nutanix, c'est la puissance du Software-Defined Architectures (SDA), qui s’appuie sur du matériel x86 standard non propriétaire. Cette approche « logiciel », offre des cycles de mise-à-jour très court dans le temps dès lors qu’une amélioration de performance matérielle est disponible.
La souplesse de cette technologie permet ainsi des évolutions rapides pour tirer profit des avantages et des performances tout de suite.
Voici les nouvelles fonctionnalités proposées dans la version 4.x
Version 4.0
Core Data Services
Hybrid On-Disk De-Duplication
(version 4.0)
La déduplication permet de partager des données de machines virtuelles clientes au niveau du stockage rapide (RAM et Flash). S’il n’y a pas suffisamment d’espace libre à ce niveau pour traiter les données actives, les performances en souffrent énormément. Dans un environnement où les VM clientes sont sensiblement identiques, ce qui est le cas par exemple pour un cluster Nutanix qui héberge des postes de travail Windows, activer la déduplication améliore considérablement les performances. Utilisée à bon escient, la déduplication permet d’optimiser la taille du stockage rapide pour accueillir un maximum de données actives.
Support officiel des « Shadow Clones »
(version 4.0)
Les Shadow Clones font enfin partis des tech-preview. Ils analysent de manière intelligente les patterns I/O sur la couche de stockage de manière à identifier les fichiers partagés en mode lecture seule (ex: les réplicas de Clones liés). La localisation des données ou des I/O devient critique lorsque l’on veut obtenir des performances optimales pour une VM et c’est l’un des points clé de NDFS. Avec les Shadow Clones, NDFS suivra l’évolution des accès aux vDisks pour localiser les données. Ainsi les données seront stockées dans le cache local du CVM où se trouve la VM et les requêtes en lecture se feront sur le même nœud du cluster Nutanix pour être traitées en local. Dans le cas de VDI avec « clones liés », cela signifie que le disque de réplica pourra être mis en cache par chaque nœud et toutes les requêtes I/O en lecture se feront localement.
Résilience
Fault Tolerance (RF-3)
(version 4.0)
Le facteur de réplication 3 (également connu sous FT2) protège les données en cas de perte de deux nœuds simultanés d’un même cluster (entre autres).
Smart Pathing
(version 4.0)
La fonctionnalité « AutoPathing 2.0 » a été améliorée pour éviter de dégrader les performances lors de l’upgrade d’une CVM, en redirigeant de manière préventive le trafic NFS à d’autres CVM du cluster afin de minimiser les délais d'E/S sur la CVM en cours de mise à jour. En fonction de la charge du nœud, la répartition du trafic se fait de manière équilibrée dans tout le cluster.
Availability Domains
(version 4.0)
Aussi connu sous les noms de « Block Fault Tolerance » ou « Rack-able Unit Fault Tolerance », Availability Domains intègre un concept de « prise de conscience de placement de blocs » lors des déploiements de clusters Nutanix. Il gère ainsi le placement des données et des métadonnées dans le cluster, veillant à ce qu'aucune donnée répliquée ne soit stockée dans le même bloc Nutanix pour garantir la haute disponibilité.
Data Protection
Snapshot Browser
(version 4.0)
La nouvelle fonctionnalité « Snapshot Browser » permet aux administrateurs de visualiser facilement, et ce à des fins de restauration, un des points de sauvegarde d’un snapshot, soit d'une VM ou d’un groupe de machines virtuelles dans un domaine de protection, local ou distant. Cette fonctionnalité est gérée au travers d’une planification très détaillée qui permet une granularité fine et une cohérence des clichés.
Planification des snapshots via « Prism »
(version 4.0)
L’interface de Nutanix permet désormais d'utiliser un calendrier basé sur la planification pour gérer les sauvegardes et la réplication en offrant la possibilité de spécifier des politiques de rétention des données par site distant. Nutanix offre une interface unique qui permet aux administrateurs de configurer et de gérer des sauvegardes de VM locales et distantes.
Amélioration de Nutanix SRA (Storage Replication Adapter)
(version 4.0)
Nutanix SRA permet maintenant une détection rapide des fichiers correspondant à une VM protégée dans SRM, supportant un maximum de 50 machines virtuelles par groupe protégé vStore dans SRM. Le support de plusieurs dispositifs SRM dans un groupe de protection SRM a été ajouté ainsi que le support pour l'exécution de plusieurs plans de recovery SRM en parallèle.
Support de « Disaster Recovery » pour Hyper-V
(version 4.0)
Nutanix 4.0 étend ses capacités DR (Disaster Recovery) à Hyper-V, offrant ainsi une solution native « VM-Centric ». Le support Hyper-V est à parité égale avec Nutanix DR pour ESX. De ce fait, en plus de protéger les fichiers associés à la machine virtuelle, être nativement « VM-centric » implique que Nutanix sait aussi orchestrer la mise hors tension, le non-enregistrement, l'enregistrement, le clonage, la mise sous tension de la machine virtuelle dans le cluster de destination.
Cloud Connect
(version 4.0)
En s’appuyant sur une architecture « multi-topologies », Nutanix permet aux administrateurs d’implémenter et gérer des stratégies « Disaster Recovery (DR) » pour les machines virtuelles réparties sur plusieurs sites et Datacenters.
Même en utilisant la fonctionnalité DR, qui permet aux administrateurs de spécifier des stratégies de rétention de snapshot, cette approche peut se révéler couteuse malgré les mécanismes de compression/déduplication activés dans le cluster. La capacité de stockage vat être fortement impactée dans le temps par les sauvegardes répétitives et les snapshots. Nutanix a officiellement annoncé la possibilité d’utiliser les services Web d’Amazon (Amazon Web Services – AWS), distribués et à haute disponibilité, pour la sauvegarde/restauration des données. Cela signifie qu’un cluster Nutanix d’un site est maintenant en mesure de sauvegarder et de restaurer des machines virtuelles à AWS, moyennent une facturation directement du géant Amazon.
Voir l'annonce de « Cloud Connect » sur le site de Nutanix
Performances
Avec la version 4.x, plusieurs améliorations côté performances ont été ajoutées, ce qui augmente les performances globales du système de 20% par rapport à la version 3.5.
Multi-disk OpLog Store
(version 4.0)
Nutanix utilise maintenant tous les disques SSD pour stocker le magasin « Oplog », augmentant à la fois la capacité « Oplog » (volumétrie du journal des opérations) et la performance en parallélisant les écritures des données Oplog sur les différents disques virtuels (vDisks) des différents SSD.
Autres
(version 4.0)
D’autres améliorations de performances ont aussi été incluses :
Fault isolation au niveau du vDisk
ODirect IO in Extent Store
ODirect IO in oplog store.
NX-8150
(version 4.0)
Sous la dénomination « NX-8150 », cette nouvelle Appliance a été spécialement développée pour les applications qui nécessitent une gestion performante du stockage, offrant une faible latence tout en délivrant un très grand nombre d’IOPs sur des volumétries élevées. La cible étant des applications de types Microsoft Exchange et SharePoint, SAP ou encore les bases de données Microsoft SQL et Oracle.
Bien que les solutions Scale-out de Nutanix gèrent déjà la grande majorité des traitements « Workload » avec ses modèles NX existants, mais certains intègrent de grosses volumétries de données actives ou un nombre très important d’IO en écriture et par conséquent, ont besoins de performances supplémentaires. Le NX-8150 de Nutanix est donc idéal pour le cloud public avec « Cloud Connect ».
« Data At Rest Encryption » (NX-3060-E, NX-3061-E, NX-6060-E)
(version 4.0)
Les clusters Nutanix sont déployés dans une variété d'environnements clients qui exigent des niveaux de sécurité différents, y compris pour les environnements classés « sensibles ». Lorsque les données sont stockées, dans un Datacenter, un Cloud public ou privé, ou une application tierce de stockage, un chiffrement approprié et la gestion des clés sont des facteurs critiques pour s'assurer que les données sont protégées et respectent les réglementations.
« Data at rest encryption » est donc l’un des principaux critères pour évaluer et pour répondre aux besoins d’un projet de décentralisation. Mais « Data at Rest Encryption » c’est quoi ? Sans rentrer dans le détail, c’est une protection des données liée à la position des disques dans leurs stockages. Si un disque est sorti de son stockage d’origine, ses données deviennent inexploitables et illisibles.
Avec « Data at Rest Encryption », Nutanix répond aux exigences réglementaires des agences gouvernementales, des services bancaires, financiers, de la santé et à bien d'autres clients qui ont besoin de garantir la sécurité de leurs données. Cette nouvelle fonctionnalité permet de crypter toutes ou certaines partitions sur le stockage persistant en utilisant un algorithme de cryptage fort, ne permettant l'accès à ces données (pour les déchiffrer) qu’avec des informations d'identification correctes. Tout comme EMC, avec « Symmetrix Data at Rest Encryption », Nutanix propose sa solution « Data at Rest Encryption » certifiée FIPS 140-2.
Gestion et Analyse
« One-click Upgrade »
(version 4.0)
Depuis la version 4.0 de son NOS, Nutanix apporte cette fonctionnalité qui permet d’automatiser la mise à jour d’un cluster. Plus besoin d’opérer manuellement en copiant les sources NOS sur une CVM du cluster, vérifier la « bonne santé » du cluster par des commandes SSH, et seulement après faire la mise à jour. Toutes ces actions manuelles sont maintenant automatisées et il suffit d’un « clic » sur le bouton « Upgrade Software » pour que la mise à jour se fasse toute seule. Il faut néanmoins activer l’option « Enable Automatic Download ». Les sources du NOS sont automatiquement téléchargées lorsqu’une nouvelle version est mise à disposition par Nutanix, mais ce mécanisme impose que le cluster ait accès à Internet. Si le cluster n’a pas accès à Internet, il est possible d’importer manuellement les sources du NOS.
Cluster Health
(version 4.0)
Nutanix « Cluster Health » est un atout majeur concernant le maintien de la disponibilité pour les Workloads de niveau 1. « Cluster Health » offre la possibilité de surveiller et de visualiser la santé globale des nœuds du cluster, des machines virtuelles et des disques à partir de vues différentes, multiples et variées. Comme il est possible de définir différents niveaux d’exigence pour les Workloads, « Cluster Health »va disséquer de manière visible tout ce qu’il est important de savoir pour vous donner tous les éléments qui vous aideront à prendre les mesures correctives si besoin.
Prism Central (interface utilisateur Multi-Clusters)
(version 4.0)
Nutanix fournit maintenant une interface utilisateur unique pour surveiller plusieurs clusters dans un même (ou plusieurs) Datacenter. Prism Central évite d'avoir à se signer individuellement à chaque Cluster et fournit par agrégation, l'intégrité des cluster concernant les alertes et les données historiques. Les administrateurs sont donc en mesure de gérer efficacement tous les Clusters Nutanix à partir de la même interface utilisateur.
Support de PowerShell
(version 4.0)
Support de commandlets PowerShell pour permettre la gestion des fonctions d’un cluster depuis l’interface de commande de Windows.
Smart Support
(version 4.0)
Lorsqu'elle est activée par l'administrateur, la fonction « Smart Support » permet d'obtenir des statistiques de tous les nœuds du cluster et envoyer un résumé à Nutanix par email. Cette information est utilisée pour le débogage et le dépannage. Dans un prochain temps, ces données pourront également être utilisées à des fins d'autodiagnostic et alerter les administrateurs des divers problèmes possibles.
Version 4.0.1.x
Configurable remote Syslog
(version 4.0.1.1)
Configurable remote Syslog permet d'envoyer des journaux à un serveur distant en utilisant les protocoles TCP / UDP. Syslog est une norme qui sert à transmettre des rapports sur des événements survenus dans un système. Il permet de séparer le logiciel qui génère des messages du système qui les stocke. Dans Nutanix, chaque journal, stockés dans /home/Nutanix/data/logs/, est préfixé par le nom du module (par exemple, cassandra) qui génère l'information.
Multi-Cluster Management Feature
(version 4.0.1.1)
Multi-cluster management feature (également connu sous le nom Prism Central), permet maintenant, de manière pratique, la mise à jour automatique des Nutanix OS dans les clusters au travers d’une console Web. Des alertes automatiques vous informent des mises à jour disponibles, que vous pouvez installer soit manuellement, soit automatiquement. La combinaison de « One-Click Upgrade » et « Firmware Upgrade » déjà implémentés dans Prism, donnent encore plus de souplesse et de puissance pour une gestion multi-Datacenters.
Support de Volume Shadow Copy Service (VSS) pour Hyper-V hosts
(version 4.0.1.1)
Nutanix offre le support de VSS pour Hyper-V pour une sauvegarde et restauration des images instantanées des machines virtuelles Hyper-V à l'aide de l'interface du service de copie miroir Microsoft Volume Shadow Copy Service(VSS). Vous pouvez restaurer une machine virtuelle à l'aide des fichiers créés par le service de copie miroir Microsoft Volume Shadow Copy Service.
Hotfix de sécurité pour la vulnérabilité « ShellShock »
(version 4.0.1.2)
Nutanix Engineering a identifié tous les vecteurs d'attaque existants associés à la faille de vulnérabilité « ShellShock », CVE-2014-6271 et CVE-2014-7169. NOS 4.0.1.2 adresses cette faille et Nutanix recommande de mettre les systèmes à niveau pour atténuer ces failles de sécurité potentielles.
Version 4.0.2
Amélioration du traitement Oplog
(version 4.0.2)
Améliorations du traitement Oplog pour parfaire la stabilité et améliorer les performances. Le Oplog, semblable à un journal du système de fichiers, est conçu pour traiter les requêtes en écriture en mode rafale, de manière à les fusionner et à les transférer en mode asynchrone dans le stockage persistant « Extent Store ». Des améliorations de performances viendront avec les notes de version officielles et PR pour NOS 4.1.
Procédure de remplacement de disques plus simple
(version 4.0.2)
Simplification de la procédure de remplacement des disques sur toutes les plateformes Nutanix par remplacement à chaud de tous types de disques durs, magnétiques et SSD, locaux et distants. Le remplacement du disque est entièrement contrôlé via PRISM GUI et nCLI. En outre, il est possible d'identifier clairement, via Prism et un indicateur lumineux (LED), l’emplacement du disque défectueux.
LED « châssis »
(version 4.0.2)
Une LED « châssis » peut maintenant être activée ou désactivée à partir de la console Prism, à partir de la page « Hardware », soit dans le diagramme, soit dans un tableau visuel pour aider à identifier correctement un bloc de Nutanix dans les gros Datacenters. C’est d’ailleurs une fonction indispensable dans gros Datacenters.
Support des Appliances Dell XC series
(version 4.0.2)
Prise en charge des Appliances Dell XC720xd series, conformément à l’accord signé entre Nutanix et Dell.
Activation par défaut des Shadow Clones
(version 4.0.2)
Les Shadow Clones sont maintenant activés par défaut. Quand un vDisk est lu par plusieurs machines virtuelles (comme l'image de base pour un pool de clone VDI), la CVM, met en cache le vDisk sur tous les nœuds du cluster. Les Shadow Clones Nutanix permettent donc une mise en cache distribuée pour un disque particulier ou des données VM, dans le cadre d’un scénario « multi-lecture ».
Version 4.1
Les apports de cette version 4.x sont principalement axés sur les domaines suivants :
Bien que les solutions Scale-out de Nutanix gèrent déjà la grande majorité des traitements « Workload » avec ses modèles NX existants, mais certains intègrent de grosses volumétries de données actives ou un nombre très important d’I/O en écriture et par conséquent, ont besoins de performances supplémentaires. Le NX-8150 de Nutanix peut être implémenté dans des clusters existants, ce qui en fait la solution idéal pour les entreprises qui traitent des Workloads critiques de niveau 1.
La nouvelle Appliance NX-9240 est conçu pour exécuter des applications avec de très grands Workloads, tels que les bases de données à traitement transactionnel en ligne (OLTP pour On-Line Transaction Processing) qui demandent non seulement les performances exceptionnelles d’un stockage rapide, mais exige aussi une latence I/O contrôlée et cohérente que le flash peut fournir.
Le stockage du NX-9240, 100% flash, offre environ 20 To RAW dans un châssis 2U.
Grace à la technologie Scale-out de Nutanix, la capacité Flash est optimisée par les fonctions de compression/déduplication qui bénéficient des ressources de calcul de tous les nœuds du cluster, en évitant les goulets d'étranglement.
Contrairement aux autres solutions, c’est un vrai stockage Scale-out, full flash. Les performances et la capacité peuvent être étendus, par simple ajout de nœuds, sans interruption de service et en garantissant une évolutivité 100% linéaire et sans limite.
Dans cette première version (NOS 4.1) les nœuds NX-9240 full flash ne peuvent pas être mélangés avec d'autres types de nœuds dans un même cluster. Cette limitation est liée à la fonction d’auto-tiering. Pour rappel, l'auto-tiering, consiste à orienter les données « chaudes » vers le flash (pour un traitement plus rapide) et les données moins sollicitées sur les disques magnétiques. Et le stockage du NX-9240 est full flash, voilà le pourquoi du comment. Par conséquent, un nouveau cluster doit être créé uniquement avec des nœuds NX-9240. Une prochaine version de NOS permettra de mixer des nœuds hybrides et full flash.
Plateforme/Infrastructure
Metro Availability
(version 4.1)
Au cours de ces deux dernières années, Nutanix a introduit de nombreuses fonctionnalités basées sur la disponibilité et la résilience de sa plate-forme. Aujourd'hui, l’éditeur a intégré les capacités de self-healing (auto-guérison), la résilience des nœuds avec des fonctions de redondance configurables, le « centric backup » avec réplication des machines virtuelles, la sauvegarde automatique vers le Cloud, et bien d'autres fonctionnalités vitales pour le fonctionnement des Workloads d'entreprise.
Toutefois, les applications d’entreprise critiques exigent une disponibilité des données en continu. Cela signifie que l'accès à l'application pour les utilisateurs doit être préservé, même si un Datacenter est indisponible, soit pour cause de sinistre ou soit par une maintenance globale planifiée. Nombre d’équipes informatique utilisent les réseaux télécom pour maintenir la connectivité entre les Datacenters, afin de garantir un plan de reprise ou de continuité d’activité en cas de perte d’un site. Cela permet de continuer à exécuter toutes les applications et les services avec un minimum de perturbations. Mais cependant, garantir un fonctionnement continu des applications exige un accès immédiat à toutes les données.
Dans son annonce officielle sur « Metro Availability », Nutanix dit, je cite «avec la version NOS 4.1 sortie cette année et ses futures releases, nous mettons en placeunenouvelle fonctionnalitéappelée« Metro Availability » dans laquelle les clusters Nutanixpourront être « étirés »(stretched) dans différentes régionsgéographiques différentes». Nutanix nous offre donc un «stretched cluster» (cluster étendu), mais sans la complexité, il suffit de regarder la vidéo ci-dessous pour s'en rendre compte, . Il est donc possible, dorénavant, d'étendre les Datastores et les conteneurs de machines virtuelles d’un cluster entre deux ou plusieurs sites situés jusqu'à 400 kilomètres de distance. Nutanix intègre nativement une réplication synchrone de données, ce qui ne nécessite aucun changement de matériel. Au cours de la réplication des données, Nutanix utilise sa technologie de compression avancée pour une efficacité optimum côté communications réseaux entre les deux Datacenters, en minimisant la bande passante de manière à accélérer la vitesse de traitement des données.
Pour les clients Nutanix existants, il est bon de savoir que la mise en œuvre de la fonction « Metro availability » utilise les mêmes concepts de groupes de protection de données qui existent déjà dans PRISM pour la sauvegarde et la réplication entre clusters Nutanix. On y ajoute une option supplémentaire de réplication synchrone. Les administrateurs sont alors en mesure de surveiller et gérer les clusters et de promouvoir des conteneurs ou bien de briser des pairs.
Par défaut, le conteneur sur un côté (site) est le principal point de service, et de l'autre côté (site) est secondaire et synchronisé, il reçoit une copie de tous les blocs de données écrits sur le site principal.
Comme les traitements se font au niveau du conteneur, il est possible d'avoir plusieurs conteneurs et Datastores, sachant que la direction de la réplication est définie au niveau de chaque conteneur.
Le Nutanix « Metro Availability » supporte les déploiements hétérogènes et ne nécessitent pas de plates-formes avec une configuration matérielle identique sur chaque site. Les équipes IT peuvent désormais migrer des machines virtuelles entre les sites au cours de travaux de maintenance planifiés, sans interruption de service et en garantissant une protection continue des données avec un RPO (Recovery Point Objective) de zéro et un RTO (Recovery Time Objective) proche de zéro.
RPO : Il correspond à la quantité maximale de données qu’il est acceptable de perdre lors d’une panne. RTO : Il correspond à la durée maximale d’interruption admissible. Le temps de redémarrage des applicatifs et leur mise en service détermine le RTO.
Les prérequis pour activer « Metro availability » sont simples :
Réseau
Une bande passante suffisante pour gérer le taux de transfert des données
Un temps de transfert <= 5 ms.
Un lien réseau redondant est également fortement recommandé.
Infrastructure
Deux groupes Nutanix groupes, un sur chaque site
Les modèles de matériel différents sont autorisés
Hyperviseur
ESXi (pour les autres hyperviseurs, ce sera pour bientôt)
Nutanix « Metro Availability » en vidéo (et en images)
Intégration
System Center Operations Manager & System Center Virtual Machine Manager
(version 4.1)
L’intégration de ces outils va permettre aux administrateurs Microsoft de surveiller les performances et la bonne santé des objets Nutanix :
« Logiciels » via SCVMM, tels que les clusters, les conteneurs de stockage, les contrôleurs VM (CVM) et autres.
« Matériels » via SCOM, tels que les nœuds de serveur, les ventilateurs, les alimentations et autres.
Voilà pour l'instant, mais comme le dit Andre LEIBOVICI sur son blog, il y a encore des plein de chose à dire sur les nouveautés de cette version, je vais donc rester à l’affut de ses écrits pour vous les retranscrire sur ce blog. Les sources de ce document viennent de son blog.
Nutanix 4.0 Features Overview (Beyond Marketing) sur ce lien
Nutanix 4.1 Features Overview (Beyond Marketing) Part 1, Part 2 et Part 3