Freigeben über


Von Azure Cosmos DB for Apache Cassandra unterstützte Apache Cassandra-Features

GILT FÜR: Kassandra

Von Bedeutung

Suchen Sie nach einer Datenbanklösung für hochskalige Szenarien mit einer Vereinbarung über verfügbarkeitsbasierte Servicelevels (Service Level Agreement, SLA) von 99,999% Verfügbarkeit, sofortige Automatische Skalierung und automatisches Failover über mehrere Regionen hinweg? Betrachten Sie Azure Cosmos DB für NoSQL.

Möchten Sie eine vorhandene Apache Cassandra-Anwendung migrieren? Betrachten Sie die von Azure verwaltete Instanz für Apache Cassandra.

Azure Cosmos DB ist ein global verteilter Datenbankdienst von Microsoft mit mehreren Modellen. Sie können mit Azure Cosmos DB for Apache Cassandra über mit Cassandra Query Language (CQL) Binary Protocol v4 Wire Protocol konforme Open-Source-Cassandra-Clienttreiber kommunizieren.

Durch Verwendung von Azure Cosmos DB for Apache Cassandra können Sie die Vorteile der Apache Cassandra-APIs sowie die von Azure Cosmos DB gebotenen Unternehmensfunktionen nutzen. Die Unternehmensfunktionen umfassen globale Verteilung, automatische Partitionierung mit Aufskalieren, Gewährleistung der Verfügbarkeit und Latenz, Verschlüsselung bei REST und Sicherungen.

Cassandra-Protokoll

Die Azure Cosmos DB für Apache Cassandra ist kompatibel mit der Cassandra Query Language (CQL) v3.11-API. Es ist abwärtskompatibel mit Version 2.x. Die unterstützten CQL-Befehle, Tools, Einschränkungen und Ausnahmen werden weiter unten in diesem Artikel aufgeführt. Alle Clienttreiber, die diese Protokolle verstehen, sollten auch mit Azure Cosmos DB for Apache Cassandra eine Verbindung herstellen können.

Azure Managed Instance für Apache Cassandra

Für einige Kunden kann die Anpassung an die API für Cassandra aufgrund von Unterschieden beim Verhalten und der Konfiguration, insbesondere bei Lift-and-Shift-Migrationen, eine Herausforderung sein. Wenn ein Feature, das für Ihre Anwendung wichtig ist, weiter unten in diesem Artikel nicht unterstützt wird, sollten Sie die Verwendung von Azure Managed Instance für Apache Cassandra in Betracht ziehen. Dieser Dienst ist ein Erstklassiger Azure-Dienst zum Hosten und Verwalten von reinen Open-Source Apache Cassandra-Clustern mit 100% Kompatibilität.

Cassandra-Treiber

Azure Cosmos DB für Apache Cassandra unterstützt die folgenden Versionen von Cassandra-Treibern:

CQL-Datentypen

Azure Cosmos DB for Apache Cassandra unterstützt die folgenden CQL-Datentypen:

type Unterstützt
ascii Ja
bigint Ja
blob Ja
boolean Ja
counter Ja
date Ja
decimal Ja
double Ja
float Ja
frozen Ja
inet Ja
int Ja
list Ja
set Ja
smallint Ja
text Ja
time Ja
timestamp Ja
timeuuid Ja
tinyint Ja
tuple Ja
uuid Ja
varchar Ja
varint Ja
tuples Ja
udts Ja
map Ja

„Static“ wird für die Datentypdeklaration unterstützt.

CQL-Funktionen

Azure Cosmos DB for Apache Cassandra unterstützt die folgenden CQL-Funktionen:

Get-Help Unterstützt
Token * Ja
ttl *** Ja
writetime *** Ja
cast ** Ja

Hinweis

* Die API für Cassandra unterstützt Token als Projektion/Selektor. Außerdem ist die Verwendung von token(pk) nur auf der linken Seite einer WHERE-Klausel zulässig. Beispiel: WHERE token(pk) > 1024 wird unterstützt, aber WHERE token(pk) > token(100) wird nicht unterstützt. ** Die Funktion „cast()“ kann in der API für Cassandra nicht geschachtelt werden. Beispiel: SELECT cast(count as double) FROM myTable wird unterstützt, aber SELECT avg(cast(count as double)) FROM myTable wird nicht unterstützt. Benutzerdefinierte Zeitstempel und TTL, die mit der USING Option angegeben sind, werden auf Zeilenebene (und nicht pro Zelle) angewendet.

Aggregatfunktionen:

Get-Help Unterstützt
avg Ja
count Ja
min Ja
max Ja
sum Ja

Hinweis

Aggregatfunktionen können für reguläre Spalten verwendet werden. Aggregate für Clusteringspalten werden jedoch nicht unterstützt.

Blob-Konvertierungsfunktionen:

Get-Help Unterstützt
typeAsBlob(value) Ja
blobAsType(value) Ja

UUID- und timeuuid-Funktionen:

Get-Help Unterstützt
dateOf() Ja
now() Ja
minTimeuuid() Ja
unixTimestampOf() Ja
toDate(timeuuid) Ja
toTimestamp(timeuuid) Ja
toUnixTimestamp(timeuuid) Ja
toDate(timestamp) Ja
toUnixTimestamp(timestamp) Ja
toTimestamp(date) Ja
toUnixTimestamp(date) Ja

CQL-Befehle

Azure Cosmos DB unterstützt für API für Cassandra-Konten die folgenden Datenbankbefehle.

Get-Help Unterstützt
ALLOW FILTERING Ja
ALTER KEYSPACE Nicht verfügbar (PaaS-Dienst, Replikation wird intern verwaltet)
ALTER MATERIALIZED VIEW Ja
ALTER ROLE Nein
ALTER TABLE Ja
ALTER TYPE Nein
ALTER USER Nein
BATCH Ja (Nur nicht protokollierter Batch)
COMPACT STORAGE Nicht verfügbar (PaaS-Dienst)
CREATE AGGREGATE Nein
CREATE CUSTOM INDEX (SASI) Nein
CREATE INDEX Ja (einschließlich benannter Indizes, aber vollständige FROZEN-Sammlung wird nicht unterstützt)
CREATE FUNCTION Nein
CREATE KEYSPACE (Replikationseinstellungen ignoriert) Ja
CREATE MATERIALIZED VIEW Ja
CREATE TABLE Ja
CREATE TRIGGER Nein
CREATE TYPE Ja
CREATE ROLE Nein
CREATE USER (in nativer Apache Cassandra-Version veraltet) Nein
DELETE Ja
DISTINCT Nein
DROP AGGREGATE Nein
DROP FUNCTION Nein
DROP INDEX Ja
DROP KEYSPACE Ja
DROP MATERIALIZED VIEW Ja
DROP ROLE Nein
DROP TABLE Ja
DROP TRIGGER Nein
DROP TYPE Ja
DROP USER (in nativer Apache Cassandra-Version veraltet) Nein
GRANT Nein
INSERT Ja
LIST PERMISSIONS Nein
LIST ROLES Nein
LIST USERS (in nativer Apache Cassandra-Version veraltet) Nein
REVOKE Nein
SELECT Ja
UPDATE Ja
TRUNCATE Ja
USE Ja

Einfache Transaktionen (Lightweight Transactions, LWT)

Komponente Unterstützt
DELETE IF EXISTS Ja
DELETE conditions Ja
INSERT IF NOT EXISTS Ja
UPDATE IF EXISTS Ja
UPDATE IF NOT EXISTS Ja
UPDATE conditions Ja

Hinweis

Aktuell werden leichte Transaktionen nicht für Konten unterstützt, bei denen mehrregionale Schreibvorgänge aktiviert sind.

CQL-Shellbefehle

Azure Cosmos DB unterstützt für API für Cassandra-Konten die folgenden Datenbankbefehle.

Get-Help Unterstützt
CAPTURE Ja
CLEAR Ja
CONSISTENCY *
COPY Nein
DESCRIBE Ja
cqlshExpand Nein
EXIT Ja
LOGIN N/A (CQL-Funktion USER wird nicht unterstützt, daher LOGIN redundant)
PAGING Ja
SERIAL CONSISTENCY *
SHOW Ja
SOURCE Ja
TRACING Nicht verfügbar (die API für Cassandra basiert auf Azure Cosmos DB: Verwenden Sie für die Problembehandlung die Diagnoseprotokollierung.)

Hinweis

Konsistenz funktioniert in Azure Cosmos DB anders. Weitere Informationen finden Sie unter Apache Cassandra und Azure Cosmos DB für Apache Cassandra-Konsistenzstufen.

JSON-Unterstützung

Get-Help Unterstützt
SELECT JSON Ja
INSERT JSON Ja
fromJson() Nein
toJson() Nein

Grenzwerte für die API für Cassandra

Azure Cosmos DB für Apache Cassandra hat keine Beschränkungen für die Größe von Daten, die in einer Tabelle gespeichert sind. Es können Hunderte von Terabytes oder Petabytes von Daten gespeichert werden. Gleichzeitig wird sichergestellt, dass die Grenzwerte für Partitionsschlüssel berücksichtigt werden. Ebenso hat jede Entität oder Zeilenentsprechung keine Grenzwerte für die Anzahl der Spalten. Die Gesamtgröße der Entität darf 2 MB nicht überschreiten. Die Daten pro Partitionsschlüssel dürfen nicht größer als 20 GB sein, wie in allen anderen APIs.

Werkzeuge

Azure Cosmos DB for Apache Cassandra ist eine verwaltete Dienstplattform. Die Plattform erfordert keinen Verwaltungsaufwand oder Dienstprogramme wie Garbage Collector, Java Virtual Machine (JVM) und Knotentool zum Verwalten des Clusters. Tools wie cqlsh, die die binäre CQLv4-Kompatibilität verwenden, werden unterstützt.

  • Der Daten-Explorer, Metriken, Protokolldiagnose, PowerShell und CLI des Azure-Portals sind andere unterstützte Mechanismen zum Verwalten des Kontos.

CQL Shell

Sie können auch in Azure Cosmos DB eine Verbindung mit der API für Cassandra herstellen, indem Sie die auf einem lokalen Computer installierte CQLSH-Instanz verwenden. Sie enthält Apache Cassandra 3.11 und kann durch Festlegen der Umgebungsvariablen sofort verwendet werden. In den folgenden Abschnitten finden Sie Anleitungen zur Installation, Konfiguration und Verbindungsherstellung mit der API für Cassandra in Azure Cosmos DB unter Windows oder Linux mit CQLSH.

Warnung

Verbindungen mit Azure Cosmos DB für Apache Cassandra funktionieren nicht mit DataStax Enterprise (DSE) oder Cassandra 4.0-Versionen von CQLSH. Stellen Sie sicher, dass Sie beim Herstellen einer Verbindung mit der API für Cassandra nur v3.11 Open Source Apache Cassandra-Versionen von CQLSH verwenden.

Fenster:

  1. Installieren Sie Python 3.

  2. Installieren Sie PIP.

    1. Laden Sie vor der Installation von PIP die get-pip.py Datei herunter.
    2. Starten Sie ein Eingabeaufforderungsfenster, falls es noch nicht geöffnet ist. Öffnen Sie dazu die Windows-Suchleiste, geben Sie cmd ein, und wählen Sie das Symbol aus.
    3. Führen Sie dann den folgenden Befehl aus, um die get-pip.py Datei herunterzuladen:
    curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py 
    
  3. Installieren von PIP unter Windows:

    python get-pip.py
    
  4. Überprüfen Sie die PIP-Installation. Suchen Sie nach einer Nachricht aus Schritt 3, um zu bestätigen, in welchem Ordner PIP installiert wurde. Navigieren Sie dann zu diesem Verzeichnis und führen Sie den Befehl pip help aus.

  5. Installieren Sie CQLSH mit PIP:

    pip3 install cqlsh==5.0.3
    
  6. Installieren Sie Python 2.

  7. Führen Sie CQLSH mithilfe des Authentifizierungsmechanismus aus.

Hinweis

Sie müssen die Umgebungsvariablen so festlegen, dass sie auf den Python 2-Ordner verweisen.

Auf Unix/Linux/Mac installieren:

# Install default-jre and default-jdk
sudo apt install default-jre
sudo apt-get update
sudo apt install default-jdk

# Import the Baltimore CyberTrust root certificate:
curl https://cacert.omniroot.com/bc2025.crt > bc2025.crt
keytool -importcert -alias bc2025ca -file bc2025.crt

# Install the Cassandra libraries in order to get CQLSH:
echo "deb https://downloads.apache.org/cassandra/debian 311x main" | sudo tee -a /etc/apt/sources.list.d/cassandra.sources.list
curl https://downloads.apache.org/cassandra/KEYS | sudo apt-key add -
sudo apt-get update
sudo apt-get install cassandra=3.11.13

Verbindung mit Unix/Linux/Mac herstellen:

# Export the SSL variables:
export SSL_VERSION=TLSv1_2
export SSL_VALIDATE=false

# Connect to Azure Cosmos DB for Apache Cassandra:
cqlsh <YOUR_ACCOUNT_NAME>.cassandra.cosmosdb.azure.com 10350 -u <YOUR_ACCOUNT_NAME> -p <YOUR_ACCOUNT_PASSWORD> --ssl --protocol-version=4

Herstellen einer Verbindung mit Docker:

docker run -it --rm -e SSL_VALIDATE=false -e SSL_VERSION=TLSv1_2 cassandra:3.11 cqlsh <account_name>.cassandra.cosmos.azure.com 10350 -u <YOUR_ACCOUNT_NAME> -p <YOUR_ACCOUNT_PASSWORD> --ssl

Alle CRUD-Vorgänge, die über ein mit CQL v4 kompatibles SDK ausgeführt werden, geben zusätzliche Informationen zu Fehler- und Anforderungseinheiten zurück, die verbraucht werden. Um die effizienteste Verwendung des bereitgestellten Durchsatzes sicherzustellen, sollten die Befehle DELETE und UPDATE unter Berücksichtigung der Ressourcengovernance bearbeitet werden.

Hinweis

Der gc_grace_seconds Wert muss null sein, falls angegeben.

var tableInsertStatement = table.Insert(sampleEntity); 
var insertResult = await tableInsertStatement.ExecuteAsync(); 
 
foreach (string key in insertResult.Info.IncomingPayload) 
        { 
            byte[] valueInBytes = customPayload[key]; 
            double value = Encoding.UTF8.GetString(valueInBytes); 
            Console.WriteLine($"CustomPayload:  {key}: {value}"); 
        } 

Konsistenzzuordnung

Azure Cosmos DB for Apache Cassandra ermöglicht die Wahl der Konsistenz bei Lesevorgängen. Weitere Informationen finden Sie unter Konsistenzstufen beim Mapping.

Berechtigungs- und Rollenverwaltung

Azure Cosmos DB unterstützt die rollenbasierte Zugriffssteuerung von Azure (Azure RBAC) für die Bereitstellung, Rotation von Schlüsseln, Anzeige von Metriken sowie Lese-/Schreibkennwörter bzw. Lese-/Schreibschlüssel und Schreibschutzkennwörter/-schlüssel, die über das Azure-Portal abgerufen werden können. Azure Cosmos DB unterstützt keine Rollen für CRUD-Aktivitäten.

Keyspace- und Tabellenoptionen

Die Optionen für Regionsname, Klasse, replication_factor und Rechenzentrum im CREATE KEYSPACE Befehl werden derzeit ignoriert. Das System verwendet die Replikationsmethode zur globalen Datenverteilung der zugrunde liegenden Azure Cosmos DB-Instanz, um die Regionen hinzuzufügen. Wenn Sie das regionsübergreifende Vorhandensein von Daten benötigen, können Sie sie auf Kontoebene mit PowerShell, CLI oder dem Azure-Portal aktivieren. Weitere Informationen finden Sie unter Hinzufügen von Regionen zu Ihrem Datenbankkonto.

„Durable_writes“ kann nicht deaktiviert werden, da Azure Cosmos DB sicherstellt, dass jeder Schreibvorgang dauerhaft ist. In jeder Region repliziert Azure Cosmos DB die Daten innerhalb der gesamten Replikatgruppe, die sich aus vier Replikaten zusammensetzt. Diese Konfiguration der Replikatgruppe kann nicht geändert werden.

Alle Optionen werden beim Erstellen der Tabelle ignoriert, mit Ausnahme von gc_grace_seconds, das auf Null gesetzt werden sollte. Der Keyspace und die Tabelle haben eine zusätzliche Option cosmosdb_provisioned_throughput mit einem Mindestwert von 400 RU/s. Der Keyspace-Durchsatz ermöglicht das Teilen des Durchsatzes über mehrere Tabellen hinweg. Es ist nützlich für Szenarien, in denen nicht alle Tabellen den bereitgestellten Durchsatz verwenden. Der ALTER TABLE Befehl ermöglicht das Ändern des bereitgestellten Durchsatzes über die Regionen hinweg.

CREATE KEYSPACE sampleks WITH REPLICATION = {  'class' : 'SimpleStrategy'} AND cosmosdb_provisioned_throughput=2000;  

CREATE TABLE sampleks.t1(user_id int PRIMARY KEY, lastname text) WITH cosmosdb_provisioned_throughput=2000; 

ALTER TABLE gks1.t1 WITH cosmosdb_provisioned_throughput=10000 ;

Sekundärer Index

Die API für Cassandra unterstützt sekundäre Indizes für alle Datentypen außer fixierten Sammlungstypen, Dezimal- und Variant-Typen.

Verwendung der Cassandra-Richtlinie für die Verbindungswiederholung

Azure Cosmos DB ist ein ressourcengesteuertes System. Sie können einige Vorgänge in einer bestimmten Sekunde basierend auf den von den Vorgängen verbrauchten Anforderungseinheiten ausführen. Überschreitet eine Anwendung dieses Limit in einer Sekunde, wird die Anforderungsrate begrenzt, und Ausnahmen werden ausgelöst. Diese Ausnahmen werden von der API für Cassandra in Azure Cosmos DB in Überladungsfehler im nativen Cassandra-Protokoll übersetzt.

Um sicherzustellen, dass Ihre Anwendung im Falle einer Ratenbegrenzung Anforderungen abfangen und wiederholen kann, werden die Erweiterungen für Spark und Java bereitgestellt. Sehen Sie sich auch Java-Codebeispiele für Datastax-Treiber der Version 3 und Version 4 an, wenn Sie eine Verbindung mit der API für Cassandra in Azure Cosmos DB herstellen. Wenn Sie über andere SDKs auf die API für Cassandra in Azure Cosmos DB zugreifen, müssen Sie eine Verbindungsrichtlinie erstellen, um für diese Ausnahmen eine Wiederholung durchzuführen. Alternativ können Sie serverseitige Wiederholungen für die API für Cassandra aktivieren.

Nächste Schritte