Google BigQuery
Bir veritabanı bağlantısı eklemek için sağ üst köşedeki dişli simgesine tıklayın ve Yönetim ayarları > Veritabanları > Veritabanı ekle bölümüne gidin.
Ön koşullar
Patrona'da kullanmak istediğiniz bir proje ile bir Google Cloud Platform hesabınızın olması gerekir. Bir proje oluşturma ve yönetme hakkında bilgi için Google Cloud Platform belgelerine bakın. Bu projenin, Patrona'nın bağlanması için bir BigQuery veri kümesine sahip olması gerekir.
Google Cloud Platform: bir hizmet hesabı ve JSON dosyası oluşturma
Öncelikle, Patrona'nın BigQuery veri kümenize erişmek için kullanabileceği bir hizmet hesabı JSON dosyasına ihtiyacınız olacak. Hizmet hesapları, API çağrılarını kimlik doğrulamak (ben kimim?) ve yetkilendirmek (ne yapabilirim?) için insan olmayan kullanıcılar (Patrona gibi uygulamalar) için tasarlanmıştır.
Hizmet hesabı JSON dosyasını oluşturmak için, BigQuery veri kümeniz için bir hizmet hesabı ayarlama hakkındaki Google'ın belgelerini izleyin. İşte temel akış:
-
Hizmet hesabı oluşturun. Google Cloud Platform proje konsolunuzdan, soldaki ana kenar çubuğu menüsünü açın, IAM ve Yönetici bölümüne gidin ve Hizmet hesabı'nı seçin. Konsol, varsa mevcut hizmet hesaplarını listeleyecektir. Ekranın üst kısmında, + HİZMET HESABI OLUŞTUR'a tıklayın.
-
Hizmet hesabı ayrıntılarını doldurun. Hizmet hesabını adlandırın ve bir açıklama ekleyin (bir ad eklediğinizde hizmet hesabı kimliği doldurulacaktır). Ardından Oluştur butonuna tıklayın.
-
Hizmet hesabına bu projeye erişim izni verin. Patrona'nın veri kümenize karşı sorguları görüntüleme ve çalıştırma iznine sahip olması için hizmet hesabına roller eklemeniz gerekecektir. Hizmet hesabına aşağıdaki rolleri eklediğinizden emin olun:
- BigQuery Veri Görüntüleyici
- BigQuery Meta Veri Görüntüleyici
- BigQuery İş Kullanıcısı (BigQuery Kullanıcısından farklı)
BigQuery'deki roller hakkında daha fazla bilgi için Google Cloud Platform'un belgelerine bakın.
- Anahtar oluşturun. Hizmet hesabına roller atadıktan sonra, Anahtar Oluştur butonuna tıklayın ve anahtar türü için JSON'ı seçin. JSON dosyası bilgisayarınıza indirilecektir.
Anahtarı yalnızca bir kez indirebilirsiniz. Anahtarı silerseniz, aynı rollere sahip başka bir hizmet hesabı oluşturmanız gerekecektir.
Ayarlar
Bu ayarları istediğiniz zaman düzenleyebilirsiniz. Sadece değişikliklerinizi kaydetmeyi unutmayın.
Görünen ad
Patrona arayüzünde veritabanı için görünen ad.
Proje Kimliği
Her BigQuery veri kümesinin bir Proje Kimliği olacaktır. Bu kimliği Google Cloud Console aracılığıyla bulabilirsiniz. Proje Kimliği'ni nerede bulacağınızdan emin değilseniz, veri kümeleri hakkında bilgi alma hakkındaki Google'ın belgelerine bakın.
Proje Kimliği'ni girerken, Proje Kimliği önekini atlayın. Örneğin, kimliğiniz
project_name:project_id
ise, yalnızcaproject_id
girin.
Hizmet hesabı JSON dosyası
JSON dosyası, Patrona uygulamanızın BigQuery veri kümelerine erişmek için ihtiyaç duyacağı kimlik bilgilerini içerir ve hizmet hesabına eklediğiniz roller tarafından tanımlanır. Ek roller eklemeniz gerekirse, başka bir hizmet hesabı oluşturmanız, JSON dosyasını indirmeniz ve dosyayı Patrona'ya yüklemeniz gerekir.
Veri kümeleri
Hangi BigQuery veri kümelerini senkronize etmek ve taramak istediğinizi belirtebilirsiniz. Seçenekler şunlardır:
- Tümü
- Sadece bunlar...
- Tümü hariç...
Bir BigQuery veri kümesi bir şemaya benzer. Veri kümesi adlarınızı (
marketing
gibi) girdiğinizden emin olun, tablo adlarınızı değil (marketing.campaigns
).
Diyelim ki üç veri kümeniz var: foo, bar ve baz.
Üç veri kümesini de senkronize etmek için Sadece bunlar...'ı seçin ve şunu girin:
foo,bar,baz
Veri kümelerini bir dize eşleşmesine göre senkronize etmek için *
joker karakterini kullanın:
- Bar ve baz'ı senkronize etmek için Sadece bunlar...'ı seçin ve
b*
dizesini girin. - Yalnızca foo'yu senkronize etmek için Tümü hariç...'ı seçin ve
b*
dizesini girin.
Yalnızca *
joker karakterinin desteklendiğini unutmayın; diğer özel karakterleri veya regex'leri kullanamazsınız.
Java Sanal Makinesi (JVM) saat dilimini kullanın
Birçok veya çoğu sorgunuzda manuel saat dilimi dönüştürme yapmıyorsanız, bunu kapalı bırakmanızı öneririz.
Kullanıcı Kimliği ve sorgu karmasını sorgularda dahil edin
Bu, denetim ve hata ayıklama için yararlı olabilir, ancak BigQuery'nin sonuçları önbelleğe almasını engeller ve maliyetlerinizi artırabilir.
Basit keşifler için sorguları yeniden çalıştırın
Bu seçeneği KAPALI duruma getirin, eğer kullanıcılar herhangi bir Özetleme veya filtre seçimi uygulamadan önce Çalıştır (oynat butonu) butonuna tıklamak istiyorsa.
Varsayılan olarak, Patrona, Özetle menüsünden bir gruplama seçeneği veya delme menüsünden bir filtre koşulu seçtiğinizde hemen bir sorgu çalıştırır. Veritabanınız yavaşsa, her tıklamada veri yüklemeyi önlemek için yeniden çalıştırmayı devre dışı bırakmak isteyebilirsiniz.
Patrona'nın ne zaman senkronize edip tarayacağını seçin
Patrona'nın veritabanınızla güncel kalmak için kullandığı sorguları yönetmek için bu seçeneği AÇIK duruma getirin. Daha fazla bilgi için bkz. Veritabanlarını senkronize etme ve tarama.
Veritabanı senkronizasyonu
Senkronizasyonların ve taramaların ne zaman yapılacağını seçin > AÇIK'ı seçtiyseniz, şunları ayarlayabilirsiniz:
- Senkronizasyon sıklığı: saatlik (varsayılan) veya günlük.
- Senkronizasyonun çalıştırılacağı zaman, Patrona uygulamanızın çalıştığı sunucunun saat diliminde.
Filtre değerleri için tarama
Patrona, bu veritabanındaki her alanda bulunan değerleri tarayarak panolar ve sorular için onay kutusu filtrelerini etkinleştirebilir. Bu, özellikle çok büyük bir veritabanınız varsa, oldukça kaynak yoğun bir işlem olabilir.
Senkronizasyonların ve taramaların ne zaman yapılacağını seçin > AÇIK'ı seçtiyseniz, Filtre değerleri için tarama altında şu seçenekleri göreceksiniz:
- Düzenli olarak, bir programda veritabanınızdaki değişim hızına uygun bir sıklıkta tarama sorguları çalıştırmanıza olanak tanır. Zaman, Patrona uygulamanızın çalıştığı sunucunun saat diliminde ayarlanır. Bu, küçük bir veritabanı veya sık güncellenen ayırt edici değerlere sahip tablolar için en iyi seçenektir.
- Yalnızca yeni bir filtre widget'ı eklerken tarama sorgularının isteğe bağlı olarak çalışmasını istiyorsanız harika bir seçenektir. Bu seçeneği AÇIK duruma getirmek, Patrona'nın yalnızca bir panele veya SQL sorusuna yeni bir filtre eklendiğinde kullanılan alan(lar)ın değerlerini tarayıp önbelleğe alacağı anlamına gelir.
- Asla, gerekirse bunu manuel olarak yapacağım çok büyük veritabanları veya gerçekten yeni değerler eklenmeyen veritabanları için bir seçenektir. Filtre değerlerinizi güncel tutmak için manuel bir tarama çalıştırmak ve alan değerlerini yeniden taramak için Alan değerlerini şimdi yeniden tara butonunu kullanın.
Periyodik olarak tablo parmak izi
Periyodik parmak izi veritabanınıza yük bindirecektir.
Bu seçeneği AÇIK duruma getirin, Patrona her senkronizasyon çalıştırdığında bir değer örneğini taramak için.
Bir parmak izi sorgusu, her sütundan ilk 10.000 satırı inceler ve bu verileri kullanarak her sütunun kaç benzersiz değere sahip olduğunu, sayısal ve zaman damgası sütunları için minimum ve maksimum değerlerin ne olduğunu tahmin eder. Bu seçeneği KAPALI bırakırsanız, Patrona yalnızca kurulum sırasında sütunlarınızı bir kez parmak izi alır.
Patrona'yı Google Drive veri kaynaklarına bağlama
Patrona'yı BigQuery aracılığıyla Google Drive veri kaynaklarına bağlayabilirsiniz. Biraz kurulum gerektirir, ancak temelde yapacağınız şey, BigQuery'de bir veri kümesi oluşturmak ve bu veri kümesine bir Google Sheet'e işaret eden bir dış tablo eklemektir. CSV dosyalarını Google Sheets'e yüklemek ve ardından verileri Patrona ile analiz etmek ve görselleştirmek için kullanışlıdır.
Google Drive'da depolanan bir veri kaynağına (örneğin, bir Google Sheet) bağlanmak için, yukarıdaki adımları tamamladığınızdan emin olun, bunlar şunlardır:
- Google Cloud Platform'da bir proje oluşturma,
- BigQuery veri kümesi ekleme ve
- hizmet hesabı oluşturma.
Hizmet hesabıyla Google Drive kaynağınızı paylaşın
Drive dosyanızı görüntülerken (örneğin, bir CSV dosyası yüklenmiş bir Google Sheet), sağ üst köşedeki Paylaş butonuna tıklayın. Kişi veya gruplar ekle etiketli metin kutusuna, Google Cloud Console'daki Hizmet Hesapları sayfasında bulabileceğiniz hizmet hesabınızın e-posta adresini yapıştırın.
Bu e-posta adresi, hizmet hesabı ve proje adlarınız uygun şekilde doldurulmuş olarak [email protected]
gibi görünecektir.
Açılır menüden Görüntüleyici'yi seçin, Kişileri bilgilendir seçeneğinin işaretini kaldırın ve Paylaş butonuna tıklayın.
Google Drive kaynağınıza işaret eden BigQuery'de bir dış tablo oluşturun
Zaten bir BigQuery veri kümeniz yoksa, bir tane oluşturun.
Ardından, Google Cloud Console'u kullanarak, BigQuery veri kümenizde Google Sheet'inize işaret eden bir dış tablo oluşturun.
Doğru Drive URI ve dosya formatını belirttiğinizden emin olun.
Henüz yapmadıysanız, Patrona'nızı BigQuery'ye bağlayın.
Bu adımları tamamladıktan sonra, bir Google Drive kaynağını veri olarak kullanarak Patrona'da sorular sorabilir ve panolar oluşturabilirsiniz.
Legacy SQL Kullanma
Sürüm 0.30.0 itibarıyla, Patrona, BigQuery'ye SQL sorgularını Standart SQL (GoogleSQL) olarak yorumlamasını söyler. Bunun yerine Legacy SQL kullanmayı tercih ediyorsanız, sorgunuzun başına bir #legacySQL
yönergesi ekleyerek Patrona'ya bunu yapmasını söyleyebilirsiniz, örneğin:
#legacySQL
SELECT *
FROM [my_dataset.my_table]
Sorun Giderme
BigQuery bağlantınızla ilgili sorun yaşıyorsanız, BigQuery sorunlarını kapsayan bu sorun giderme kılavuzuna, veri ambarı bağlantılarıyla ilgili bu kılavuza göz atabilir veya Patrona'nın tartışma forumunu ziyaret ederek birinin benzer bir sorunu çözmüş olup olmadığını görebilirsiniz.