Jaa


Mikä on graafitietokanta?

Note

Tämä ominaisuus on tällä hetkellä julkisessa esikatselussa. Tämä esikatselu tarjotaan ilman palvelutasosopimusta, eikä sitä suositella tuotantokuormituksiin. Tiettyjä ominaisuuksia ei ehkä tueta tai niiden ominaisuudet voivat olla rajoitettuja. Lisätietoja löytyy Supplemental Terms of Use for Microsoft Azure Previews.

Graafitietokannat tarjoavat tehokkaan tavan mallintaa ja kysyä yhdistettyä dataa. Toisin kuin perinteiset relaatiotietokannat, jotka tallentavat dataa taulukoihin, graafitietokannat esittävät tietoa solmuina (entiteetteinä) ja reunoina (suhteina), mikä helpottaa monimutkaisten yhteyksien ja kuvioiden joustavampaa tutkimista. Tässä artikkelissa selitetään graafitietokantojen ydinkäsitteet, miten graafikyselyt toimivat, ja kuvataan, milloin graafitietokannan käyttöä kannattaa harkita työkuormassasi. Se vertaa myös Fabric Graphia itsenäisiin graafitietokanta-alueisiin.

Yleisimmin käytetty graafitietokantatyyppi toteuttaa merkityn ominaisuusgraafin (LPG) mallin: entiteetit (solmut) ja suhteet (reunat) voivat olla tunnisteilla ja ominaisuuksilla (avain–arvoparit). Tämä joustava malli mahdollistaa sekä skeemapohjaisen että skeemapohjaisen suunnittelun, ja sen avulla voit ilmaista monipuolista semantiikkaa. Koska yhteydet tallennetaan eksplisiittisesti reunoina, kyselyt kulkevat suhteiden läpi seuraamalla reunoja sen sijaan, että ne laskeisivat kalliita liitoksia kyselyn aikana.

Tärkeää

Tässä artikkelissa käytetään yksinomaan sosiaalisen verkoston esimerkkikaaviodatasettiä.

Kaaviotietokannan ydinkäsitteet

  • Solmut edustavat entiteettejä, kuten ihmisiä, tuotteita tai paikkoja. Solmuilla voi olla otsikoita ja ominaisuuksia, jotka kuvaavat niiden määritteitä. Esimerkiksi henkilösolmussa voi olla ominaisuuksia kuten etunimi, sukunimi ja ikä.
  • Reunat kuvaavat, miten entiteetit ovat yhteydessä toisiinsa, esimerkiksi FRIENDS_WITH, OSTETTU tai LOCATED_IN. Reunoilla voi myös olla ominaisuuksia ja otsikoita suhteen metatietojen koodaamiseksi.
  • Ominaisuudet liittävät tietoja solmuihin ja reunoihin (esimerkiksi henkilön nimi tai reunan päivämäärä). Koska suhteet tallennetaan eksplisiittisesti reunoina, kyselyt navigoivat kaaviossa seuraamalla yhteyksiä sen sijaan, että ne laskettaisiin kyselyn aikana.

Miten suhteiden kysely toimii?

Kaaviokyselyt hakevat yhdistettyä tietoa kulkemalla aloitussolmusta naapureilleen, sitten naapureilleen ja niin edelleen. Läpikäynnin suorittama työ on sidottu sen koskettamien reunojen määrään (paikallinen naapurusto), ei tietojoukon kokonaiskokoon. Tämä ominaisuus tekee kysymyksistä poluista, yhteyksistä ja kaavoista – kuten ystävien ystävistä, lyhyimmistä poluista tai monihyppäisriippuvuuksista – luonnollisia ja tehokkaita ilmaista.

Graafitietokannat käyttävät mallipohjaisia kyselykieliä, kuten yhä suositumpaa Graph Query Language (GQL) -kieltä, kuvaamaan näitä läpikulkuja ytimekkäästi. Sama kansainvälinen työryhmä, joka valvoo SQL:ää (ISO/IEC 39075), standardoi GQL:ää, mikä sovittaa graafikyselyt vakiintuneisiin tietokantastandardeihin.

Esimerkki (kuvion yhteensopivuus GQL:n kanssa):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Tämä kuvio kuuluu näin: aloitetaan Annemarien Person-solmusta, seuraa :knows reunoja jokaiseen ystäväsolmuun ja seuraa :likes reunoja liittyviin :Comment solmuihin. Palauta 100 uusinta näistä kommenteista niiden luomispäivän mukaan.

Mallinnus ja skeema

Kaaviotietomallit ovat skeemavalinnaisia: voit käyttää kiinteää rakennetta, kun tarvitset vahvaa hallintoa, tai kehittää mallia, kun uusia solmutyyppejä, suhteita tai ominaisuuksia tulee näkyviin. Tämä lähestymistapa vähentää tietojen päällekkäisyyden tarvetta ja antaa tiimeille mahdollisuuden yhdistää tietoja useista lähteistä ilman raskasta etukäteissuunnittelua.

Kaaviotietokantojen yleiset käyttötarkoitukset

Graafitietokannat ovat tiiviisti linjassa niiden domainien kanssa, joilla yhteydet tuottavat arvoa, kuten:

  • Yhteisöpalveluverkot
  • Tietokaaviot
  • Suositusjärjestelmät
  • Petos- ja riskiverkostot
  • Verkko- ja IT-topologia
  • Toimitusketjun riippuvuusanalyysi

Näissä skenaarioissa kysymykset eivät koske niinkään yksittäisiä tietueita vaan enemmän sitä, kuinka monta entiteettiä liittyy ja on vuorovaikutuksessa useiden hyppyjen aikana.

Milloin kannattaa harkita kaaviotietokantaa

Valitse graafitietokanta, kun:

  • Pääkysymyksesi liittyvät polkuihin, naapurustoihin ja kuvioihin yhdistetyssä datassa.
  • Humalan määrä vaihtelee tai ei ole etukäteen tiedossa.
  • Sinun täytyy yhdistää ja navigoida suhteita eri tietoaineistojen välillä.

Jos kysyt tällaisia kysymyksiä säännöllisesti, graafimalli sopii luonnollisesti.

Miten Fabric Graph vertautuu itsenäisiin graafitietokantoihin

Datan esittäminen graafina ja sen tallentaminen erilliseen, itsenäiseen graafitietokantaan tuo usein mukanaan ETL:n (extract, transform, load) ja hallinnon ylikuormitusta. Sen sijaan Graph toimii suoraan OneLakessa, mikä vähentää tai poistaa tarpeen erillisille ETL-putkille ja datan päällekkäisyydelle. Harkitse näitä kompromisseja:

  • Datan siirto ja päällekkäisyys: Itsenäiset graafitietokannat vaativat tyypillisesti datan poimimisen, muuntamisen ja lataamisen erilliseen tallennustilaan, mikä lisää monimutkaisuutta ja voi johtaa päällekkäisiin tietoaineistoihin. Graph toimii OneLakella, joten voit mallintaa ja kysyä yhdistettyä dataa ilman, että sitä siirretään.
  • Käyttökustannukset: Erilliset kaaviopinot toimivat erillisinä klustereina tai palveluina, ja niihin liittyy usein käyttämättömyysmaksuja. Graph-työkuormat Graphissa käyttävät yhdistettyjä kapasiteettiyksiköitä (CU) automaattisilla skaalauksilla ja keskitetyillä mittareilla, mikä yksinkertaistaa toimintaa ja voi alentaa kustannuksia.
  • Skaalautuvuus: Jotkin erilliset kaaviotietokannat ovat riippuvaisia skaalauksesta tai toimittajakohtaisesta klusteroinnista. Graph on suunniteltu laajamittaisille graafeille ja käyttää skaalautuvaa shardingia useiden työntekijöiden kesken hallitakseen suurten datakuormien tehokkaasti.
  • Työkalut ja taidot: Toimittajakohtaiset graafijärjestelmät voivat vaatia erikoistuneita kieliä ja erillisiä analytiikkakehyksiä. Graph tarjoaa yhtenäisen mallinnuksen, standardipohjaisen kyselyn (GQL), sisäänrakennetut graafianalytiikkaalgoritmit, BI- ja tekoälyintegraation sekä low/no-code-tutkimustyökalut. Nämä ominaisuudet mahdollistavat laajemman käyttäjäjoukon työskentelyn yhdistetyn datan kanssa.
  • Hallinto ja turvallisuus: Erilliset graafien käyttöönotot vaativat itsenäisiä hallinta- ja turvallisuusratkaisuja. Graph käyttää OneLake-hallintaa, linjausta ja työtilan roolipohjaista käyttöoikeuksien hallintaa (RBAC), joten vaatimustenmukaisuus, auditointi ja käyttöoikeudet pysyvät yhdenmukaisina muun Fabric-ympäristösi kanssa.