|
| 1 | +# Restore IP Addresses - 全有効IPv4アドレスの列挙 |
| 2 | + |
| 3 | +<h2 id="toc">目次</h2> |
| 4 | + |
| 5 | +- [概要](#overview) |
| 6 | +- [アルゴリズム要点(TL;DR)](#tldr) |
| 7 | +- [図解](#figures) |
| 8 | +- [正しさのスケッチ](#correctness) |
| 9 | +- [計算量](#complexity) |
| 10 | +- [Python実装](#impl) |
| 11 | +- [CPython最適化ポイント](#cpython) |
| 12 | +- [エッジケースと検証観点](#edgecases) |
| 13 | +- [FAQ](#faq) |
| 14 | + |
| 15 | +--- |
| 16 | + |
| 17 | +<h2 id="overview">概要</h2> |
| 18 | + |
| 19 | +与えられた数字文字列 `s` に対し、**3つのドット**を挿入して**4つのセグメント**を作り、全ての有効なIPv4アドレスを列挙する問題。 |
| 20 | + |
| 21 | +**要件**: |
| 22 | +- 各セグメントは 0〜255 の整数(先頭ゼロ禁止、ただし単独の `"0"` は許可) |
| 23 | +- 文字の順序変更・削除は不可(挿入のみ) |
| 24 | +- 有効な組み合わせを全て返す(順不同) |
| 25 | + |
| 26 | +**制約**: |
| 27 | +- `1 <= s.length <= 20` |
| 28 | +- `s` は数字のみ |
| 29 | + |
| 30 | +--- |
| 31 | + |
| 32 | +<h2 id="tldr">アルゴリズム要点(TL;DR)</h2> |
| 33 | + |
| 34 | +- **戦略**:深さ優先探索(DFS)+ 強い枝刈り |
| 35 | + - 各セグメントは1〜3桁を試行 |
| 36 | + - 残文字数の上下限チェックで早期枝刈り |
| 37 | + - 先頭ゼロ・255超過で即座に棄却 |
| 38 | +- **データ構造**: |
| 39 | + - 固定長配列 `path[4]` でセグメントを再利用 |
| 40 | + - 事前キャッシュ `_SEG_CACHE[0..255]` で部分文字列生成を回避 |
| 41 | +- **計算量**: |
| 42 | + - 時間:O(1)(n≤20、実質的には最大 3^4=81 分岐だが強い枝刈りで大幅削減) |
| 43 | + - 空間:O(1)(出力を除く) |
| 44 | +- **メモリ最適化**: |
| 45 | + - スライス生成を一切行わず、キャッシュ文字列への参照のみ使用 |
| 46 | + - 探索中の一時オブジェクト生成をほぼゼロに |
| 47 | + |
| 48 | +--- |
| 49 | + |
| 50 | +<h2 id="figures">図解</h2> |
| 51 | + |
| 52 | +### フローチャート:DFS探索の流れ |
| 53 | + |
| 54 | +```mermaid |
| 55 | +flowchart TD |
| 56 | + Start[Start: idx=0, seg=0] --> Check{seg == 4?} |
| 57 | + Check -- Yes --> Final{idx == n?} |
| 58 | + Final -- Yes --> AddRes[Append result to res] |
| 59 | + Final -- No --> Return1[Return without adding] |
| 60 | + Check -- No --> Prune{Remaining chars valid?} |
| 61 | + Prune -- No --> Return2[Return early prune] |
| 62 | + Prune -- Yes --> TryLen[Try length 1 to max_len] |
| 63 | + TryLen --> BuildVal[Build value digit by digit] |
| 64 | + BuildVal --> CheckVal{val <= 255?} |
| 65 | + CheckVal -- No --> BreakLoop[Break loop] |
| 66 | + CheckVal -- Yes --> SetPath[Set path segment from cache] |
| 67 | + SetPath --> Recurse[Recurse: idx+len, seg+1] |
| 68 | + Recurse --> Check |
| 69 | + AddRes --> Return3[Return] |
| 70 | + Return1 --> End[End] |
| 71 | + Return2 --> End |
| 72 | + Return3 --> End |
| 73 | + BreakLoop --> End |
| 74 | +``` |
| 75 | + |
| 76 | +**説明**: |
| 77 | +- 深さ4のDFSで各セグメントを決定 |
| 78 | +- 残文字数が `[remainSegs, remainSegs*3]` の範囲外なら早期リターン |
| 79 | +- 先頭が `'0'` なら長さ1のみ試行(`max_len=1`) |
| 80 | +- 逐次数値化(`val = val*10 + digit`)で255超過を検出したら即座にループ脱出 |
| 81 | +- 有効なセグメントはキャッシュから参照して `path` に格納 |
| 82 | + |
| 83 | +### データフロー図 |
| 84 | + |
| 85 | +```mermaid |
| 86 | +graph LR |
| 87 | + subgraph Input_Validation |
| 88 | + A[Input string s] --> B[Check length 4 to 12] |
| 89 | + B --> C[Check digits only] |
| 90 | + end |
| 91 | + subgraph DFS_Core |
| 92 | + C --> D[Initialize path array] |
| 93 | + D --> E[DFS with pruning] |
| 94 | + E --> F[Try segment lengths] |
| 95 | + F --> G[Validate value range] |
| 96 | + G --> H[Use cached strings] |
| 97 | + end |
| 98 | + subgraph Output |
| 99 | + H --> I[Collect valid IPs] |
| 100 | + I --> J[Return result list] |
| 101 | + end |
| 102 | +``` |
| 103 | + |
| 104 | +**説明**: |
| 105 | +- 入力検証で範囲外・不正文字を早期棄却 |
| 106 | +- DFSコアで効率的な探索(枝刈り + キャッシュ参照) |
| 107 | +- 結果リストに有効なIPのみ蓄積 |
| 108 | + |
| 109 | +--- |
| 110 | + |
| 111 | +<h2 id="correctness">正しさのスケッチ</h2> |
| 112 | + |
| 113 | +**不変条件**: |
| 114 | +- `path[0..seg-1]` は全て有効なセグメント(0〜255、先頭ゼロ条件満足) |
| 115 | +- `idx` は現在処理中の文字位置、`seg` は埋まったセグメント数 |
| 116 | + |
| 117 | +**網羅性**: |
| 118 | +- 各セグメントで可能な長さ(1〜3、先頭ゼロなら1のみ)を全て試行 |
| 119 | +- 枝刈りは「解が存在しない」ケースのみを除外(残文字不足/過剰、255超過) |
| 120 | + |
| 121 | +**基底条件**: |
| 122 | +- `seg == 4` かつ `idx == n`:全文字を使い切って4セグメント完成 → 解として追加 |
| 123 | +- `seg == 4` だが `idx < n`:文字が余る → 不正 |
| 124 | + |
| 125 | +**終了性**: |
| 126 | +- `idx` は単調増加、`seg` も単調増加 |
| 127 | +- 最大深さ4で再帰終了 |
| 128 | + |
| 129 | +--- |
| 130 | + |
| 131 | +<h2 id="complexity">計算量</h2> |
| 132 | + |
| 133 | +| 指標 | 値 | 備考 | |
| 134 | +|------|-----|------| |
| 135 | +| **時間計算量** | **O(1)** | 入力長 n≤20、各セグメント1〜3桁で最大3^4=81分岐だが、枝刈りで実際は大幅削減。出力サイズを除けば定数時間 | |
| 136 | +| **空間計算量** | **O(1)** | 固定長配列 `path[4]` のみ使用。再帰深さ4も定数。キャッシュ `_SEG_CACHE` はクラス変数で共有 | |
| 137 | + |
| 138 | +**最適化の効果**: |
| 139 | +- **スライス生成ゼロ**:`s[idx:idx+len]` を作らず、キャッシュ `_SEG_CACHE[val]` への参照のみ |
| 140 | +- **逐次数値化**:`ord()` でループ内で桁を加算、`int()` 変換を回避 |
| 141 | +- **早期枝刈り**:残文字数の上下限で不可能な分岐を即座に排除 |
| 142 | + |
| 143 | +--- |
| 144 | + |
| 145 | +<h2 id="impl">Python実装</h2> |
| 146 | + |
| 147 | +```python |
| 148 | +from __future__ import annotations |
| 149 | +from typing import List, TYPE_CHECKING |
| 150 | + |
| 151 | +class Solution: |
| 152 | + """ |
| 153 | + Restore IP Addresses(メモリ最適化版) |
| 154 | + - 0..255 の文字列を事前キャッシュして、部分文字列生成を回避 |
| 155 | + - 固定長配列 path を再利用し、探索中の一時オブジェクトを最小化 |
| 156 | + """ |
| 157 | + |
| 158 | + # 共有キャッシュ:0〜255 を文字列化して再利用 |
| 159 | + _SEG_CACHE: List[str] = [str(i) for i in range(256)] |
| 160 | + |
| 161 | + def restoreIpAddresses(self, s: str) -> List[str]: |
| 162 | + """ |
| 163 | + 全ての有効なIPv4アドレスを列挙 |
| 164 | +
|
| 165 | + Args: |
| 166 | + s: 数字のみから成る文字列 |
| 167 | +
|
| 168 | + Returns: |
| 169 | + 生成可能な全ての有効IPv4アドレス(順不同) |
| 170 | +
|
| 171 | + Raises: |
| 172 | + TypeError: 入力がstrでない、または数字以外を含む場合 |
| 173 | +
|
| 174 | + Complexity: |
| 175 | + Time: O(1)(n≤20、最大3^4分岐、出力を除く) |
| 176 | + Space: O(1)(path固定長のみ、出力を除く) |
| 177 | + """ |
| 178 | + # 入力検証 |
| 179 | + if not isinstance(s, str): |
| 180 | + raise TypeError("Input must be a string.") |
| 181 | + |
| 182 | + n: int = len(s) |
| 183 | + |
| 184 | + # 数字のみ許可 |
| 185 | + for ch in s: |
| 186 | + if ch < '0' or ch > '9': |
| 187 | + raise TypeError("Input must contain digits only.") |
| 188 | + |
| 189 | + # IPv4は合計4〜12桁のみ成立 |
| 190 | + if n < 4 or n > 12: |
| 191 | + return [] |
| 192 | + |
| 193 | + res: List[str] = [] |
| 194 | + path: List[str] = [""] * 4 # 固定長配列・再利用 |
| 195 | + SEG = self._SEG_CACHE # ローカル束縛で属性探索を削減 |
| 196 | + |
| 197 | + def dfs(idx: int, seg: int) -> None: |
| 198 | + """ |
| 199 | + 深さ優先探索でセグメントを決定 |
| 200 | +
|
| 201 | + Args: |
| 202 | + idx: 現在の文字位置 |
| 203 | + seg: 埋まったセグメント数(0〜4) |
| 204 | + """ |
| 205 | + # 基底条件:4セグメント完成 |
| 206 | + if seg == 4: |
| 207 | + if idx == n: |
| 208 | + # 全文字使い切り → 有効なIP |
| 209 | + res.append(".".join(path)) |
| 210 | + return |
| 211 | + |
| 212 | + remain_segs = 4 - seg |
| 213 | + remain_chars = n - idx |
| 214 | + |
| 215 | + # 枝刈り:残文字数が不足または過剰 |
| 216 | + if remain_chars < remain_segs or remain_chars > remain_segs * 3: |
| 217 | + return |
| 218 | + |
| 219 | + # 先頭が '0' なら長さ1のみ許可 |
| 220 | + first_is_zero = s[idx] == '0' |
| 221 | + max_len = 1 if first_is_zero else 3 |
| 222 | + |
| 223 | + val = 0 # セグメント数値を逐次生成 |
| 224 | + for length in range(1, max_len + 1): |
| 225 | + if idx + length > n: |
| 226 | + break |
| 227 | + |
| 228 | + # 逐次数値化:val = val*10 + digit |
| 229 | + val = val * 10 + (ord(s[idx + length - 1]) - 48) |
| 230 | + |
| 231 | + # 255超過したら以降は全て不正 |
| 232 | + if val > 255: |
| 233 | + break |
| 234 | + |
| 235 | + # キャッシュから文字列参照(スライス生成なし) |
| 236 | + path[seg] = SEG[val] |
| 237 | + dfs(idx + length, seg + 1) |
| 238 | + |
| 239 | + dfs(0, 0) |
| 240 | + return res |
| 241 | +``` |
| 242 | + |
| 243 | +**主要ステップ**: |
| 244 | +1. 入力検証(長さ・文字種) |
| 245 | +2. DFS開始(`idx=0, seg=0`) |
| 246 | +3. 各セグメントで1〜3桁を試行(先頭ゼロなら1のみ) |
| 247 | +4. 残文字数の上下限で枝刈り |
| 248 | +5. 逐次数値化で255超過を検出したらループ脱出 |
| 249 | +6. 有効なセグメントはキャッシュから参照して `path` に格納 |
| 250 | +7. 4セグメント完成時、全文字使い切りなら結果に追加 |
| 251 | + |
| 252 | +--- |
| 253 | + |
| 254 | +<h2 id="cpython">CPython最適化ポイント</h2> |
| 255 | + |
| 256 | +1. **スライス回避**: |
| 257 | + - `s[idx:idx+len]` の代わりに `_SEG_CACHE[val]` への参照のみ |
| 258 | + - 探索中の一時 `str` オブジェクト生成をほぼゼロに |
| 259 | + |
| 260 | +2. **属性アクセス削減**: |
| 261 | + - `SEG = self._SEG_CACHE` でローカル変数に束縛 |
| 262 | + - ループ内での属性探索コストを削減 |
| 263 | + |
| 264 | +3. **逐次数値化**: |
| 265 | + - `val = val * 10 + (ord(s[i]) - 48)` で桁を加算 |
| 266 | + - `int(s[idx:idx+len])` の変換コストを回避 |
| 267 | + |
| 268 | +4. **固定長配列の再利用**: |
| 269 | + - `path: List[str] = [""] * 4` で固定長確保 |
| 270 | + - push/pop せずインデックス代入のみでV8(CPython)に最適 |
| 271 | + |
| 272 | +5. **早期枝刈り**: |
| 273 | + - 残文字数の上下限チェックで不可能な分岐を即座に排除 |
| 274 | + - `val > 255` で即座にループ脱出 |
| 275 | + |
| 276 | +**結果**: |
| 277 | +- LeetCode上で **Runtime 0ms(100%)**、**Memory 17.79MB(76.42%)** を達成 |
| 278 | +- メモリは出力リスト自体のサイズも含むため、解の個数が多い入力では不可避に増加 |
| 279 | + |
| 280 | +--- |
| 281 | + |
| 282 | +<h2 id="edgecases">エッジケースと検証観点</h2> |
| 283 | + |
| 284 | +| ケース | 入力例 | 期待出力 | 検証ポイント | |
| 285 | +|--------|--------|----------|--------------| |
| 286 | +| **最小長** | `"1111"` | `["1.1.1.1"]` | 4文字で1解のみ | |
| 287 | +| **全ゼロ** | `"0000"` | `["0.0.0.0"]` | 先頭ゼロ許可(単独"0") | |
| 288 | +| **長さ不足** | `"123"` | `[]` | n<4で即座に空リスト | |
| 289 | +| **長さ過剰** | `"1"*13` | `[]` | n>12で即座に空リスト | |
| 290 | +| **先頭ゼロ** | `"010010"` | `["0.10.0.10", "0.100.1.0"]` | 先頭ゼロは長さ1のみ | |
| 291 | +| **255境界** | `"25525511135"` | `["255.255.11.135", "255.255.111.35"]` | 255は有効、256は不正 | |
| 292 | +| **複数解** | `"101023"` | 5解(例題参照) | 全分岐の網羅性 | |
| 293 | +| **不正文字** | `"12a34"` | `TypeError` | 数字以外を含む入力 | |
| 294 | + |
| 295 | +**検証観点**: |
| 296 | +- 残文字数の上下限枝刈りが正しく機能するか |
| 297 | +- 先頭ゼロの処理(`max_len=1`)が正しいか |
| 298 | +- 逐次数値化で255超過を正しく検出するか |
| 299 | +- キャッシュ参照が元の桁列と一致するか |
| 300 | + |
| 301 | +--- |
| 302 | + |
| 303 | +<h2 id="faq">FAQ</h2> |
| 304 | + |
| 305 | +**Q1: なぜスライスを避けるのか?** |
| 306 | +- A: `s[idx:idx+len]` は毎回新しい `str` オブジェクトを生成し、GC圧が高まる。キャッシュ参照なら既存オブジェクトの再利用で割り当てゼロ。 |
| 307 | + |
| 308 | +**Q2: `_SEG_CACHE` はどれくらいメモリを使うか?** |
| 309 | +- A: 256個の文字列(`"0"`〜`"255"`)で合計約2KB程度。クラス変数として共有されるため、インスタンスごとの追加コストはゼロ。 |
| 310 | + |
| 311 | +**Q3: LeetCodeのMemoryスコアが100%にならない理由は?** |
| 312 | +- A: 出力リスト自体のサイズが含まれるため、解の個数が多い入力では不可避に増加。中間オブジェクトは最小化済み。 |
| 313 | + |
| 314 | +**Q4: 先頭ゼロの処理が正しいか?** |
| 315 | +- A: `first_is_zero` で先頭が `'0'` なら `max_len=1` に制限。`"01"` や `"001"` は試行されない。 |
| 316 | + |
| 317 | +**Q5: 枝刈りの効果は?** |
| 318 | +- A: 残文字数の上下限チェックで、不可能な分岐(例:残り1文字で2セグメント必要)を即座に排除。実測で探索回数を大幅削減。 |
| 319 | + |
| 320 | +**Q6: 他のアプローチと比較すると?** |
| 321 | +- A: 3重ループ(ドット位置総当り)は実装容易だが条件判定が散在。DFS + 枝刈りは制御フローが明確で高速。 |
| 322 | + |
| 323 | +**Q7: ジェネレータにできないか?** |
| 324 | +- A: LeetCodeの関数シグネチャは `List[str]` 返却固定。プロダクションなら `yield` で逐次処理可能。 |
| 325 | + |
| 326 | +**Q8: 並列化は有効か?** |
| 327 | +- A: 探索空間が小さい(最大3^4)ため、GILのオーバーヘッドで逆に遅くなる。単一スレッドで十分。 |
0 commit comments