dokumentacja testow

This commit is contained in:
Grzegorz Michalski
2026-02-09 07:49:12 +01:00
parent 7864c568d7
commit 293f2873b7
3 changed files with 545 additions and 0 deletions

View File

@@ -0,0 +1,205 @@
# Analiza parametru pMaxFileSize dla DATA_EXPORTER.EXPORT_TABLE_DATA_TO_CSV_BY_DATE
## Pytanie
Jaki maksymalnie można ustawić parametr `pMaxFileSize` przy `pParallelDegree => 1` w procedurze `CT_MRDS.DATA_EXPORTER.EXPORT_TABLE_DATA_TO_CSV_BY_DATE`?
## Odpowiedź
### Limity Oracle DBMS_CLOUD.EXPORT_DATA
**UWAGA**: Komentarz w kodzie źródłowym (`DATA_EXPORTER.pkb`, linia 444-449) zawiera **BŁĘDNĄ** informację o maksymalnym limicie 1GB.
```sql
-- Oracle maxfilesize: min 10MB (10485760), max 1GB (1073741824), default 10MB -- NIEPRAWIDŁOWE!
-- NOTE: maxfilesize must be NUMBER (bytes), not string like '1000M'
-- Using 100MB (104857600) to avoid PGA memory issues with large files
```
**Rzeczywiste limity Oracle** (zweryfikowane testami 2026-02-05):
- **Minimum**: 10 MB (10,485,760 bajtów)
- **Maksimum**: **4,294,967,295 bajtów** (4 GB - 1 bajt) = **2^32 - 1** (unsigned 32-bit integer max)
- **Wartość = 4GB** (4,294,967,296): ORA-01426 numeric overflow
### Test Environment
- **Oracle Database**: Oracle AI Database 26ai Enterprise Edition Release 23.26.1.1.0
- **PGA Configuration**:
- pga_aggregate_target: 3000M (3GB)
- pga_aggregate_limit: 6000M (6GB) - hard limit
- **Test Dataset**: OU_CSDB.LEGACY_DEBT table (1,014,078 rows)
- **OCI Object Storage**: eu-frankfurt-1 region
### Wartości graniczne
| Parametr | Wartość (bajty) | Wartość (MB/GB) | Status |
|----------|----------------|-----------------|---------|
| **Minimum** | 10,485,760 | 10 MB | Oracle minimum |
| **Aktualny standard** | 104,857,600 | 100 MB | Używane w kodzie |
| **Zalecane bezpieczne (parallel)** | 524,288,000 | 500 MB | Dla pParallelDegree > 1 |
| **Zalecane bezpieczne (sequential)** | 1,073,741,824 | 1 GB | Dla pParallelDegree = 1 |
| **Maksimum Oracle** | **4,294,967,295** | **~4 GB** | **2^32 - 1 (unsigned 32-bit max)** |
| **Błąd numeric overflow** | 4,294,967,296 | 4 GB | ORA-01426 (dokładnie 2^32) |
### Odpowiedź na pytanie
**Maksymalna wartość pMaxFileSize przy pParallelDegree => 1:**
```sql
pMaxFileSize => 1073741824 -- 1 GB (1,073,741,824 bajtów)
```
## Przykład użycia z maksymalną wartością
```sql
BEGIN
CT_MRDS.DATA_EXPORTER.EXPORT_TABLE_DATA_TO_CSV_BY_DATE(
pSchemaName => 'OU_CSDB',
pTableName => 'LEGACY_DEBT',
pKeyColumnName => 'A_ETL_LOAD_SET_FK',
pBucketArea => 'DATA',
pFolderName => 'ODS/CSDB/CSDB_DEBT',
pMinDate => DATE '2024-01-01',
pMaxDate => SYSDATE,
pParallelDegree => 1, -- Sequential processing
pTemplateTableName => 'CT_ET_TEMPLATES.CSDB_DEBT',
pMaxFileSize => 1073741824 -- 1GB - MAXIMUM możliwa wartość
);
END;
/
```
## Rekomendacje
### Dla pParallelDegree => 1 (przetwarzanie sekwencyjne)
1. **Maksimum bezwzględne**: 1 GB (1,073,741,824 bajtów)
- To jest twardy limit Oracle DBMS_CLOUD.EXPORT_DATA
- Wartości powyżej 1GB spowodują błąd Oracle
2. **Zalecane wartości w zależności od scenariusza**:
- **Małe tabele** (< 1M rekordów): 100 MB (104,857,600) - aktualny standard
- **Średnie tabele** (1-10M rekordów): 250 MB (262,144,000)
- **Duże tabele** (> 10M rekordów): 500 MB (524,288,000)
- **Bardzo duże tabele** z dużą ilością RAM: 1 GB (1,073,741,824)
3. **Kwestie pamięciowe (PGA)**:
- W komentarzu kodu widoczne jest ostrzeżenie: "avoid PGA memory issues"
- Przy `pParallelDegree => 1` (brak równoległości), ryzyko błędu ORA-04036 jest niższe
- Można bezpiecznie używać wyższych wartości niż przy przetwarzaniu równoległym
### Dla pParallelDegree > 1 (przetwarzanie równoległe)
- **Maksimum techniczne**: nadal 1 GB
- **Zalecane**: 100-200 MB z powodu pamięci PGA
- **Aktualny standard**: 100 MB (bezpieczna wartość)
## Różnice względem przetwarzania równoległego
| Aspekt | pParallelDegree = 1 | pParallelDegree > 1 |
|--------|---------------------|---------------------|
| **Maksimum Oracle** | 1 GB | 1 GB |
| **Zalecane max** | 500 MB - 1 GB | 100-200 MB |
| **Ryzyko ORA-04036** | Niskie | Wysokie (wiele procesów) |
| **Użycie PGA** | Pojedynczy proces | Wielokrotne procesy |
## Skrypty testowe
Przygotowano dwa skrypty testowe:
### 1. Pełny test (7 scenariuszy)
**Plik**: `MARS_Packages/tests/test_maxfilesize_parameter.sql`
- Test z wartościami: 10MB, 100MB, 250MB, 500MB, 750MB, 1GB, 1.5GB
- Automatyczne czyszczenie testowych plików
- Szczegółowe logowanie wyników
### 2. Szybki test (maksimum)
**Plik**: `MARS_Packages/tests/test_maxfilesize_quick.sql`
- Jednorazowy test z maksymalną wartością 1GB
- Szybka weryfikacja poprawności konfiguracji
### Uruchomienie testów
```powershell
# Pełny test wszystkich wartości
Get-Content "MARS_Packages\tests\test_maxfilesize_parameter.sql" | sql "CT_MRDS/Cloudpass#34@ggmichalski_high"
# Szybki test maksymalnej wartości
Get-Content "MARS_Packages\tests\test_maxfilesize_quick.sql" | sql "CT_MRDS/Cloudpass#34@ggmichalski_high"
```
## Wnioski (zaktualizowane 2026-02-05)
1. **Maksymalna wartość Oracle** dla `pMaxFileSize` wynosi **4,294,967,295 bajtów** (4 GB - 1 bajt)
- To jest **2^32 - 1** = maksymalna wartość unsigned 32-bit integer
- Wartość >= 4,294,967,296 (dokładnie 4GB) powoduje ORA-01426 numeric overflow
- **Komentarz w kodzie źródłowym o limicie 1GB jest NIEPRAWIDŁOWY**
2. **Zalecana wartość dla pParallelDegree = 1** (sequential): **1-2 GB**
- Niskie ry~4GB można używać dla bardzo dużych tabel (teoretycznie)cyjnym
- Maksimum 3GB można używać dla bardzo dużych tabel
3. **Zalecana wartość dla pParallelDegree > 1** (parallel): **100-500 MB**
- Wysokie ryzyko ORA-04036 przy wielu wątkach i dużych wartościach
- Aktualny standard 100MB jest bezpieczny ale konserwatywny
4. **Weryfikacja testowa** (2026-02-05):
- 1GB (1,073,741,824): ✅ DZIAŁA
- 2GB (2,147,483,648): ✅ DZIAŁA
- 3GB (3,221,225,472): ✅ DZIAŁA
- 3.5GB (3,758,096,384): ✅ DZIAŁA
- 3.9GB (4,187,593,113): ✅ DZIAŁA
- 3.99GB (4,284,481,126): ✅ DZIAŁA
- **4GB - 1 bajt (4,294,967,295)**: ✅ DZIAŁA - **MAKSIMUM ORACLE** (2^32 - 1)
- **4GB (4,294,967,296)**: ❌ ORA-01426 numeric overflow (2^32)
- 5GB+: ❌ ORA-01426 numeric overflow
5. **Test z pojedynczym wątkiem** (2026-02-05):
- pMaxFileSize = 4,294,967,295, pParallelDegree = 1, 60 partycji
- Result: ❌ ORA-04036 (PGA memory exceeded - limit 6GB)
- Wniosek: Parametr jest akceptowany, ale sekwencyjne przetwarzanie wielu partycji przekracza limit PGA
- **Dla 60+ partycji używaj pParallelDegree=4 zamiast 1**
## Kod źródłowy - fragment kluczowy
Z pliku `DATA_EXPORTER.pkb`, procedura `EXPORT_SINGLE_PARTITION`:
```sql
-- Use json_object() for CSV export with maxfilesize in bytes (Oracle requirement)
-- Oracle maxfilesize: min 10MB (10485760), max 1GB (1073741824), default 10MB
-- NOTE: maxfilesize must be NUMBER (bytes), not string like '1000M'
-- Using 100MB (104857600) to avoid PGA memory issues with large files
DBMS_CLOUD.EXPORT_DATA(
credential_name => pCredentialName,
file_uri_list => vUri,
query => vQuery,
format => json_object(
'type' VALUE 'CSV',
'header' VALUE true,
'quote' VALUE CHR(34),
'delimiter' VALUE ',',
'escape' VALUE true,
'recorddelimiter' VALUE CHR(13)||CHR(10),
'maxfilesize' VALUE pMaxFileSize -- Dynamic maxfilesize in bytes
)
);
```
(1,073,741,824): ✅ Sukces
- Test 2GB (2,147,483,648): ✅ Sukces - komentarz w kodzie BŁĘDNY
- Test 3GB (3,221,225,472): ✅ Sukces
- Test 3.5GB (3,758,096,384): ✅ Sukces
- Test 3.75GB (4,026,531,840): ✅ Sukces
- Test 3.9GB (4,187,593,113): ✅ Sukces
- Test 3.99GB (4,284,481,126): ✅ Sukces
- Test **4GB - 1 bajt (4,294,967,295)**: ✅ Sukces - **MAKSIMUM = 2^32 - 1**
- Test 4GB (4,294,967,296): ❌ ORA-01426 numeric overflow (dokładnie 2^32)
- Test 5GB+: ❌ ORA-01426 numeric overflow
- Test **4GB-1 + parallel=1 + 60 partycji**: ❌ ORA-04036 PGA memory exceeded
**Konkluzja**: Komentarz w `DATA_EXPORTER.pkb` o maksymalnym limicie 1GB był nieprawidłowy. Rzeczywiste maksimum Oracle DBMS_CLOUD.EXPORT_DATA to **4,294,967,295 bajtów** (4 GB - 1 bajt), co odpowiada maksymalnej wartości **unsigned 32-bit integer (2^32 - 1)**. Jednakże, **w środowisku Autonomous Database z limitami PGA** (pga_aggregate_limit=6GB), sekwencyjne przetwarzanie dużej liczby partycji (60+) może przekroczyć limit pamięci nawet z poprawną wartością parametru
- Test 3GB: ✅ Sukces - rzeczywiste maksimum Oracle
- Test 4GB: ❌ ORA-01426 numeric overflow
- Test 5GB+: ❌ ORA-01426 numeric overflow
**Konkluzja**: Komentarz w `DATA_EXPORTER.pkb` o maksymalnym limicie 1GB był nieprawidłowy. Rzeczywiste maksimum Oracle DBMS_CLOUD.EXPORT_DATA to **3 GB**.
### 2026-02-04 - Analiza początkowa
Pierwsza wersja dokumentacji oparta na komentarzach w kodzie źródłowym.